2015-04-30 13 views
5

Ho un array di NumPy come segue:Ottenere argsort dell'array NumPy

array([ True, True, True, True, True, False, True, True, False, 
     True, False, True, True, True, True, True, True, False, 
     False, False, False, False, True, True, False, False, False, 
     True, True, True, True, True, True, True, False, True, 
     True, True, True, False, True, True, False, False, True, 
     True, True, False, True, True, True, False], 

voglio ottenere gli indici di tutti gli elementi veri. Non esiste un metodo get_loc in numpy come Pandas Series e allo stesso modo nessun metodo di indice come una lista. Non voglio convertirlo in un elenco e quindi utilizzare .index.

Qualche idea?

risposta

4

Uso ndarray.nonzero:

>>> a.nonzero() 
(array([ 0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 
     28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 
     50]),) 
0

Per fare questo in panda:

In [255]: 

s[s==True].index 
Out[255]: 
Int64Index([0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 50], dtype='int64') 

Aggiornamento

In realtà è possibile utilizzare il fatto che i valori sono valori già booleani per mascherare il serie:

In [256]: 

s[s].index 
Out[256]: 
Int64Index([0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 50], dtype='int64') 

Allo stesso modo per gli array NumPy è possibile utilizzare i valori booleani per mascherare l'array e ottenere i valori di indice utilizzando np.where:

In [261]: 

np.where(a) 
​ 
Out[261]: 
(array([ 0, 1, 2, 3, 4, 6, 7, 9, 11, 12, 13, 14, 15, 16, 22, 23, 27, 
     28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 44, 45, 46, 48, 49, 
     50], dtype=int64),) 
0

Il modo np.ix_ sembra essere il più lento.

In [846]: % timeit a.nonzero() 
1000000 loops, best of 3: 707 ns per loop 

In [845]: % timeit np.where(a) 
1000000 loops, best of 3: 883 ns per loop 

In [849]: %timeit np.ix_(a==True) 
100000 loops, best of 3: 9.21 µs per loop