Ho due frame di dati. Esempi:Confronto di due frame di dati e acquisizione delle differenze
df1:
Date Fruit Num Color
2013-11-24 Banana 22.1 Yellow
2013-11-24 Orange 8.6 Orange
2013-11-24 Apple 7.6 Green
2013-11-24 Celery 10.2 Green
df2:
Date Fruit Num Color
2013-11-24 Banana 22.1 Yellow
2013-11-24 Orange 8.6 Orange
2013-11-24 Apple 7.6 Green
2013-11-24 Celery 10.2 Green
2013-11-25 Apple 22.1 Red
2013-11-25 Orange 8.6 Orange
Ogni dataframe ha la data come un indice. Entrambi i dataframe hanno la stessa struttura.
Quello che voglio fare è confrontare questi due dataframes e trovare quali file sono in df2 che non sono in df1. Voglio confrontare la data (indice) e la prima colonna (Banana, APple, ecc.) Per vedere se esistono in df2 vs df1.
Ho provato quanto segue:
- Outputting difference in two Pandas dataframes side by side - highlighting the difference
- Comparing two pandas dataframes for differences
Per il primo approccio ottengo questo errore: "Eccezione: può solo confrontare gli oggetti dataframe identicamente-etichettati". Ho provato a rimuovere la data come indice ma ottengo lo stesso errore.
Sul numero third approach, ho ottenuto l'asserzione per restituire False ma non riesco a capire come effettivamente vedere le diverse righe.
Qualsiasi puntatori sarebbe il benvenuto
Se si esegue questa operazione: http://www.cookbook-r.com/Manipulating_data/Renaming_columns_in_a_data_frame/, sarà sbarazzarsi di eccezione gli 'oggetti dataframe identico-etichettati'? –
Ho cambiato i nomi delle colonne molte volte per cercare di aggirare il problema senza fortuna. –
FWIW, ho modificato i nomi delle colonne come "a, b, c, d" su entrambi i frame di dati e ricevere lo stesso messaggio di errore. –