Sto tuffandomi nei panda e sperimentando. Per quanto riguarda la lettura dei dati da un file Excel. Mi chiedo quale sia la differenza tra l'utilizzo di ExcelFile in read_excel. Entrambi sembrano funzionare (anche se con una sintassi leggermente diversa, come ci si potrebbe aspettare), e la documentazione supporta entrambi. In entrambi i casi, la documentazione descrive lo stesso metodo: "Legge una tabella Excel in DataFrame" e "Legge una tabella Excel in un DataFrame panda". (documentation for read_excel)ExcelFile vs. read_excel in panda
Sto vedendo le risposte qui su SO che utilizza entrambi, senza affrontare la differenza. Inoltre, una ricerca su Google non ha prodotto un risultato che discute questo problema.
WRT mio test, questi sembrano equivalenti:
path = "test/dummydata.xlsx"
xl = pd.ExcelFile(path)
df = xl.parse("dummydata") # sheet name
e
path = "test/dummydata.xlsx"
df = pd.io.excel.read_excel(path, sheetname=0)
a parte il fatto che quest'ultimo mi salva una linea, c'è una differenza tra i due, ed è lì un motivo per usare uno dei due?
Grazie!
non salva nemmeno una linea, perché: df = pd.ExcelFile (percorso) .parse ("dummydata") – MarioTheHedgehog