Ho un df panda dataframe:Replica group_concat per pandas.DataFrame
+------+---------+
| team | user |
+------+---------+
| A | elmer |
| A | daffy |
| A | bugs |
| B | dawg |
| A | foghorn |
| B | speedy |
| A | goofy |
| A | marvin |
| B | pepe |
| C | petunia |
| C | porky |
+------+---------
voglio trovare o scrivere una funzione per restituire un dataframe che sarei tornato in MySQL utilizzando la seguente:
SELECT
team,
GROUP_CONCAT(user)
FROM
df
GROUP BY
team
per il seguente risultato:
+------+---------------------------------------+
| team | group_concat(user) |
+------+---------------------------------------+
| A | elmer,daffy,bugs,foghorn,goofy,marvin |
| B | dawg,speedy,pepe |
| C | petunia,porky |
+------+---------------------------------------+
posso pensare a modi brutto per farlo scorrendo sopra le righe e Addin g ad un dizionario, ma deve esserci un modo migliore.
Se ho bisogno di questo tipo di cose da caricare nuovamente a un dataframe (e, idealmente, essere in grado di specificare il nome della colonna della colonna raggruppata) come potrei farlo? – Chad
Si potrebbe provare 'df.groupby ('team'). Apply (lambda x: list (x.user)). To_pickle ('pickle.pkl')'. –
potresti aggiungere la nuova colonna? – user1532587