Ho n file in una directory che ho bisogno di combinare in uno. Essi hanno la stessa quantità di colonne, ad esempio, il contenuto di test1.csv
sono:utilizzando panda in python per aggiungere file CSV in uno
test1,test1,test1
test1,test1,test1
test1,test1,test1
Allo stesso modo, il contenuto di test2.csv
sono:
test2,test2,test2
test2,test2,test2
test2,test2,test2
voglio final.csv di simile a questa:
test1,test1,test1
test1,test1,test1
test1,test1,test1
test2,test2,test2
test2,test2,test2
test2,test2,test2
ma invece viene fuori in questo modo:
test file 1,test file 1.1,test file 1.2,test file 2,test file 2.1,test file 2.2
,,,test file 2,test file 2,test file 2
,,,test file 2,test file 2,test file 2
test file 1,test file 1,test file 1,,,
test file 1,test file 1,test file 1,,,
Qualcuno può aiutarmi a capire cosa sta succedendo qui? Ho incollato il mio codice di seguito:
import csv
import glob
import pandas as pd
import numpy as np
all_data = pd.DataFrame() #initializes DF which will hold aggregated csv files
for f in glob.glob("*.csv"): #for all csv files in pwd
df = pd.read_csv(f) #create dataframe for reading current csv
all_data = all_data.append(df) #appends current csv to final DF
all_data.to_csv("final.csv", index=None)
Perché stai usando i Panda solo per creare un singolo CSV? –
Sono un noob e ho pensato che fosse il modo migliore per farlo. :/ –