Ho un problema in cui produco un dataframe di panda concatenando lungo l'asse di riga (impilando verticalmente).Panda ricalcolare l'indice dopo una concatenazione
Ciascuno dei datafram costituenti ha un indice generato automaticamente (numeri in ordine crescente).
Dopo la concatenazione, il mio indice è rovinato: conta fino a n (dove n è la forma [0] del dataframe corrispondente) e si riavvia a zero al prossimo dataframe.
Sto provando a "ricalcolare l'indice, dato l'ordine corrente", o "reindicizzare" (o almeno così pensavo). Risulta che non è esattamente quello che sembra fare DataFrame.reindex
.
Ecco quello che ho cercato di fare: "non può reindicizzare da un asse duplicato"
train_df = pd.concat(train_class_df_list)
train_df = train_df.reindex(index=[i for i in range(train_df.shape[0])])
non è riuscito con Non voglio modificare l'ordine dei miei dati ... ho solo bisogno di cancellare il vecchio indice e di crearne uno nuovo, con l'ordine delle righe preservato.
Questo è più diretto di '.reset_index (drop = True)' e quindi preferisco IMO, ma la denominazione è un po 'meno chiara – Dmitri