Ho un dataframe pandas
con più righe che si avvicinano a duplicati l'uno con l'altro, ad eccezione di un valore. Il mio obiettivo è unire o "coalizzare" queste righe in una singola riga, senza sommare i valori numerici.panda - Unisci quasi duplicate righe in base al valore di colonna
Ecco un esempio di quello che sto lavorando con:
Name Sid Use_Case Revenue
A xx01 Voice $10.00
A xx01 SMS $10.00
B xx02 Voice $5.00
C xx03 Voice $15.00
C xx03 SMS $15.00
C xx03 Video $15.00
Ed ecco quello che vorrei:
Name Sid Use_Case Revenue
A xx01 Voice, SMS $10.00
B xx02 Voice $5.00
C xx03 Voice, SMS, Video $15.00
Il motivo per cui non voglio riassumere il "Ricavi "La colonna è perché la mia tabella è il risultato di un pivot su diversi periodi in cui" Revenue "finisce semplicemente per essere elencato più volte invece di avere un valore diverso per" Use_Case ".
Quale sarebbe il modo migliore per affrontare questo problema? Ho esaminato la funzione groupby()
ma ancora non la capisco molto bene.
Se la risposta di mio o di Ami è stata utile, non dimenticare [accettare] (http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work). Grazie. – jezrael
Grazie! Entrambi funzionano bene. Potrei dover unire un paio di colonne in quanto il mio dataset effettivo è molto più ampio del 4 che ho fornito, ma questo dovrebbe fare il trucco –