2015-12-16 43 views
6

Ho un dataframe che assomiglia a questo:Pandas GroupBy con bin conta

+----------+---------+-------+ 
| username | post_id | views | 
+----------+---------+-------+ 
| john  |  1 |  3 | 
| john  |  2 | 23 | 
| john  |  3 | 44 | 
| john  |  4 | 82 | 
| jane  |  7 |  5 | 
| jane  |  8 | 25 | 
| jane  |  9 | 46 | 
| jane  |  10 | 56 | 
+----------+---------+-------+ 

e vorrei trasformarlo contare viste che appartengono a determinate bidoni in questo modo:

+------+------+-------+-------+--------+ 
|  | 1-10 | 11-25 | 25-50 | 51-100 | 
+------+------+-------+-------+--------+ 
| john | 1 |  1 |  1 |  1 | 
| jane | 1 |  1 |  1 |  1 | 
+------+------+-------+-------+--------+ 

I provato:

bins = [1, 10, 25, 50, 100] 
groups = df.groupby(pd.cut(df.views, bins)) 
groups.username.count() 

Ma fornisce solo conteggi aggregati e non conteggi per utente. Come posso ottenere i conteggi dei contenitori per utente?

I conteggi aggregati (usando il mio vero dati) si presenta così:

impressions 
(2500, 5000]   2332 
(5000, 10000]  1118 
(10000, 50000]  570 
(50000, 10000000]  14 
Name: username, dtype: int64 

risposta

7

Si potrebbe gruppo da entrambi i bidoni e nome utente, calcolare le dimensioni del gruppo e quindi utilizzare unstack():

>>> groups = df.groupby(['username', pd.cut(df.views, bins)]) 
>>> groups.size().unstack() 
views  (1, 10] (10, 25] (25, 50] (50, 100] 
username 
jane   1   1   1   1 
john   1   1   1   1 
Problemi correlati