Ho file CSV, che ho letto in in panda con:Leggi tutto ma nell'ultima riga del file CSV in panda
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
Purtroppo, l'ultima riga di questi file è spesso corrotta (ha il numero sbagliato di virgole). Attualmente apro ciascun file in un editor di testo e rimuovo l'ultima riga.
E 'possibile rimuovere l'ultima riga nello stesso script python/panda che carica il CSV per evitare di dover fare questo passo in più non automatizzato?
Hai eliminato una domanda sull'estrazione di numeri, comunque stavo per suggerire di usare 'str.extract':' per col in df.columns [2:]: df [col] = df [col] .str.extract (r '(\ d +)'). astype (int) ' – EdChum
@EdChum Grazie! – eleanora
@EdChum Il codice lascia i punti decimali? – eleanora