ho un df dataframe, con due colonne, voglio groupby una colonna e unire le liste appartiene allo stesso gruppo, esempio:panda GroupBy e unire elenchi
column_a, column_b
1, [1,2,3]
1, [2,5]
2, [5,6]
dopo il processo:
column_a, column_b
1, [1,2,3,2,5]
2, [5,6]
Voglio conservare tutti i duplicati. Ho le seguenti domande:
- I dtypes del dataframe sono oggetto/i. convert_objects() non converte column_b in lista automaticamente. Come posso fare questo?
- a cosa si applica la funzione in df.groupby (...). Apply (lambda x: ...)? qual è la forma di x? elenco?
- la soluzione al mio problema principale?
Grazie in anticipo.
grazie, ho un'altra domanda: cosa succede se ho una terza colonna che è un tipo di stringa, e voglio "" .un loro per gruppo di colonna uno. Cosa dovrei fare? –
Le stringhe sono come elenchi di caratteri. Quindi '.sum()' dovrebbe funzionare anche lì. – TomAugspurger
Sì, ma voglio un '' (spazio bianco) tra ogni stringa concatenata. –