2013-05-22 8 views
12

Se abbiamo un valore noto in una colonna, come possiamo ottenere il suo valore di indice? Ad esempio:In PANDAS, come ottenere l'indice di un valore noto?

In [148]: a = pd.DataFrame(np.arange(10).reshape(5,2),columns=['c1','c2']) 
In [149]: a 
Out[149]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
........ 

Come sappiamo, si può ottenere un valore dall'indice corrispondente ad esso, come questo.

In [151]: a.ix[0,1] In [152]: a.c2[0] In [154]: a.c2.ix[0] <-- use index 
Out[151]: 1   Out[152]: 1   Out[154]: 1   <-- get value 

Ma come ottenere l'indice in base al valore?

risposta

24

Ci potrebbe essere più di una mappa indice per il vostro valore, più senso per restituire un elenco:

In [48]: a 
Out[48]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
3 6 7 
4 8 9 

In [49]: a.c1[a.c1 == 8].index.tolist() 
Out[49]: [4] 
+0

Un indice può avere voci non univoci, perché dici ha più senso per restituire un elenco? –

+0

Hmm, penso che sia il mio torto. Se tutti gli indici sono unici, possiamo ottenere l'indice singolo da 'a.c1 [a.c1 == 8] .index.tolist() [0]' – waitingkuo

+0

grazie per la tua risposta, è un buon ideale. Non ho considerato l'oggetto indice può essere convertito in lista semplice. Grazie Agagin. – user2407991

4

Il contrario utilizzando numpy.where():

import numpy as np 
import pandas as pd 

In [800]: df = pd.DataFrame(np.arange(10).reshape(5,2),columns=['c1','c2']) 

In [801]: df 
Out[801]: 
    c1 c2 
0 0 1 
1 2 3 
2 4 5 
3 6 7 
4 8 9 

In [802]: np.where(df["c1"]==6) 
Out[802]: (array([3]),) 

In [803]: indices = list(np.where(df["c1"]==6)[0]) 

In [804]: df.iloc[indices] 
Out[804]: 
    c1 c2 
3 6 7 

In [805]: df.iloc[indices].index 
Out[805]: Int64Index([3], dtype='int64') 

In [806]: df.iloc[indices].index.tolist() 
Out[806]: [3] 
3

utilizzando la [] di accesso .loc:

In [25]: a.loc[a['c1'] == 8].index[0] 
Out[25]: 4 

anche possibile utilizzare il get_loc() impostando 'c1' come l'indice. Questo non cambierà il dataframe originale.

In [17]: a.set_index('c1').index.get_loc(8) 
Out[17]: 4 
0

per ottenere l'indice per valore, è sufficiente aggiungere .index [0] alla fine di una query. Ciò restituirà l'indice della prima riga del risultato ...

Quindi, applicati sulla dataframe:

In [1]: a[a['c2'] == 1].index[0]  In [2]: a[a['c1'] > 7].index[0] 
Out[1]: 0       Out[2]: 4       

Se la query restituisce più di una riga, i risultati dell'indice aggiuntivi possono essere accesso specificando l'indice desiderato, ad es .index [n]

In [3]: a[a['c2'] >= 7].index[1]  In [4]: a[(a['c2'] > 1) & (a['c1'] < 8)].index[2] 
Out[3]: 4       Out[4]: 3 
Problemi correlati