2012-04-18 11 views
5

Ho dati aggregati usando la cornice dati panda. Di seguito sono riportati alcuni dati effettivi e come sono stati aggregati.dati aggregati di panda su una matrice numpy: conversione della struttura dati

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

Cosa vorrei fare è creare una matrice NumPy 2d di questo (righe = fila, colonne = col). Qualche modo perfetto per farlo?

Un altro modo in cui ho fatto qualcosa di simile è stato creare una tabella pivot

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

In questo caso voglio convertire questo tabella pivot per 2d serie NumPy. C'è un modo per me di indicizzare ogni cella di questo tavolo. Se è così allora probabilmente starò bene con il tavolo stesso.

risposta

6

Prova:

result = fdf.groupby(['row',col'])['percent'].sum() 
result.unstack('col').values 

alternativa:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values 
Problemi correlati