2016-02-24 32 views
5

Ho un dataframe panda come il seguentepanda GroupBy e convertire alla lista JSON

idx, f1, f2, f3 
1, a, a, b 
1, b, a , c 
1, a, b, c 
. 
. 
. 
86 
87 e, e , e 

ho bisogno di convertire le altre colonne alla lista dei dizionari sulla base della colonna idx. quindi, il risultato finale dovrebbe essere:

idx, features 
1 , [{f1:a, f2:a, f3:b}, {f1:b, f2:a, f3:c}, {f1:a, f2:b, f3:c}] 
. 
. 
. 
87, [{f1: e, f2:e, f3:e}] 

E 'possibile fare qualcosa di simile usando groupby in panda?

risposta

2

È possibile utilizzare groupby da index e poi applyto_json:

print df 
    f1 f2 f3 
idx   
1 a a b 
1 b a c 
1 a b c 
87 e e e 

print df.groupby(level=0).apply(lambda x: x.to_json(orient='records')) 

1  [{"f1":"a","f2":"a","f3":"b"},{"f1":"b","f2":"... 
87      [{"f1":"e","f2":"e","f3":"e"}] 
dtype: object 

O se colonna idx non è index:

print df 
    idx f1 f2 f3 
0 1 a a b 
1 1 b a c 
2 1 a b c 
3 87 e e e 

print df.groupby('idx').apply(lambda x: x.to_json(orient='records')) 
idx 
1  [{"idx":1,"f1":"a","f2":"a","f3":"b"},{"idx":1... 
87    [{"idx":87,"f1":"e","f2":"e","f3":"e"}] 
dtype: object 
+0

come funziona? Si prega di non dimenticare accettare la soluzione, se fosse utile. Grazie. – jezrael