2012-04-12 11 views
5

sto cercando di ottenere una bincount di una matrice NumPy, che è di tipo float:Numpy bincount() con carri

w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) 
print np.bincount(w) 

Come si può utilizzare bincount() con valori float e non int?

+2

cosa ti aspetti come risultato da questo tipo di operazione "strano"? – luke14free

+1

Voglio conoscere il numero di occorrenze di ciascun valore. Quindi il risultato sarebbe: [2,1,1,1] Come 0,1 si verifica due volte e gli altri una volta. – user1220022

risposta

4

Vuoi qualcosa del genere?

>>> from collections import Counter 
>>> w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) 
>>> c = Counter(w) 

Counter({0.10000000000000001: 2, 0.5: 1, 0.29999999999999999: 1, 0.20000000000000001: 1}) 

o, più piacevolmente uscita:

Counter({0.1: 2, 0.5: 1, 0.3: 1, 0.2: 1}) 

È quindi possibile ordinare e ottenere i vostri valori:

>>> np.array([v for k,v in sorted(c.iteritems())]) 

array([2, 1, 1, 1]) 

L'uscita del bincount non avrebbe senso con i galleggianti:

>>> np.bincount([10,11]) 
array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1]) 

in quanto non esiste una sequenza definita di galleggianti.

9

È necessario utilizzare numpy.unique prima di utilizzare bincount. Altrimenti è ambiguo quello che stai contando. unique dovrebbe essere molto più veloce di Counter per gli array numpy.

>>> w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) 
>>> uniqw, inverse = np.unique(w, return_inverse=True) 
>>> uniqw 
array([ 0.1, 0.2, 0.3, 0.5]) 
>>> np.bincount(inverse) 
array([2, 1, 1, 1]) 
3

A partire dalla versione 1.9.0, è possibile utilizzare direttamente np.unique:

w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) 
values, counts = np.unique(w, return_counts=True)