Oggi sono rimasto sorpreso positivamente dal fatto che, durante la lettura dei dati da un file di dati (per esempio) panda è in grado di riconoscere i tipi di valori:I panda possono riconoscere automaticamente le date?
df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3'])
Ad esempio può essere controllato in questo modo:
for i, r in df.iterrows():
print type(r['col1']), type(r['col2']), type(r['col3'])
In particolare interi, i float e le stringhe sono stati riconosciuti correttamente. Tuttavia, ho una colonna che ha date nel seguente formato: 2013-6-4
. Queste date sono state riconosciute come stringhe (non come oggetti data di Python). C'è un modo per "imparare" i panda alle date riconosciute?
Non ha funzionato per me, ho ricevuto il seguente errore: 'TypeError: strptime() argomento 1 deve essere str, non float' –
Ho ricevuto questo errore perché c'erano nan nel mio frame di dati. –
puoi aggiungere un elemento che contiene anche il materiale non analizzabile o NaN o/N. perché sembra che questo parser salti l'intera colonna se qualcosa del genere è presente – Amir