Ho un file di foglio di calcolo (.xlsx) che sto elaborando usando i panda python. Succede che ho bisogno di dati da due schede in quel file di grandi dimensioni. Una delle schede ha una tonnellata di dati e l'altra è composta da poche celle quadrate.Utilizzo di panda su pd.read_excel() per più fogli di lavoro della stessa cartella di lavoro
Quando uso pd.read_excel() su qualsiasi foglio di lavoro, sembra a me come l'intero file viene caricato (non solo il foglio di lavoro che mi interessa). Quindi quando uso il metodo due volte (una volta per ogni foglio), devo effettivamente subire l'intera cartella di lavoro in lettura due volte (anche se stiamo usando solo il foglio specificato).
Sto usando male o è limitato in questo modo?
Grazie!
FWIW, sembra che (l'ultima volta che ho testato) i primi di linea carichi in * tutto *, quindi non c'è alcun modo di tirare in modo efficiente solo un singolo foglio, ma almeno ottenere più fogli non richiede più carichi dell'intero foglio. – HaPsantran
Questa risposta è stata deprecata dai panda e ora si blocca per me in v0.21.0. Dovrebbe essere sostituito da quello indicato da @ Mat0kan. – DStauffman
@DStauffman Questo funziona ancora bene per me e non vedo alcuna indicazione dal codice o dai documenti che questo sia deprecato. Se hai problemi con questo, vorrei sottoporre un problema al github per pandas o xlrd (la libreria di parsing excel python usata dai panda) – Noah