Ho un file csv che contiene 130.000 righe. Dopo aver letto il file usando la funzione read_csv dei pandas, uno dei Column ("CallGuid") ha tipi di oggetti misti.l'importazione pandas read_csv fornisce il tipo misto per una colonna
ho fatto:
df = pd.read_csv("data.csv")
Poi ho questo:
In [10]: df["CallGuid"][32767]
Out[10]: 4129237051L
In [11]: df["CallGuid"][32768]
Out[11]: u'4129259051'
Tutte le righe < = 32767 sono di tipo long
e tutte le righe> 32767 sono unicode
Perché è questo?
Hai controllato quella riga nel tuo csv originale? Potrebbe essere quotato o avere qualche altro problema, cosa succede se si esegue 'df = pd.read_csv (" data.csv ", skiprows = 32768)' il dtype è sbagliato? – EdChum
@EdChum dopo aver inserito skiprows = 32768 Ho perso i nomi delle colonne, che erano nella riga 0, come mantenere la riga dell'intestazione? – lessthanl0l
do 'skiprows = [32768]'. Hai saltato le prime 32768 righe senza '[]' – TomAugspurger