Sto provando a leggere un file di testo delimitato da tabulazione in un dataframe.Errore lettura pda
Questo è il modo in cui il file è in Excel:
CALENDAR_DATE ORDER_NUMBER INVOICE_NUMBER TRANSACTION_TYPE CUSTOMER_NUMBER CUSTOMER_NAME
5/13/2016 0:00 13867666 6892372 S 2026 CUSTOMER 1
Importazione in un df:
df = p.read_table("E:/FileLoc/ThisIsAFile.txt", encoding = "iso-8859-1")
Ora non vede le prime 3 colonne come parte dell'indice di colonna (df [0] = Tipo di transazione) e tutte le intestazioni cambiano per riflettere questo.
CALENDAR_DATE ORDER_NUMBER INVOICE_NUMBER
5/13/2016 0:00 13867666 6892372 S 2026 CUSTOMER 1
Sto cercando di manipolare il file di testo e quindi importarlo in un database mysql come risultato finale.
Cercando read_csv, ottengo: ValueError: attesi 7 campi in linea 3, ha visto 17 – ctd25
Cos'è il separatore di dati? Puoi aprire il file 'txt' nell'editor di testo come' Notepad ++ 'e controllarlo? – jezrael
Siamo spiacenti, è separato da tabulazione – ctd25