Ho circa 100 file CSV ogni 100.000 x 40
righe
colonne. Mi piacerebbe fare qualche analisi statistica su di esso, estrarre alcuni dati di esempio, tracciare le tendenze generali, fare la varianza e l'analisi del quadrato R e tracciare alcuni diagrammi di spettri. Per ora, sto pensando a numpy per l'analisi.Python: analisi su file CSV 100.000 righe x 40 colonne
Mi chiedevo quali problemi dovrei aspettarmi con file così grandi? Ho già controllato dati errati. Quali sono i tuoi consigli su come fare analisi statistiche? sarebbe meglio se dividessi semplicemente i file e facessi il tutto in Excel?
Questi file non sono molto grandi. Perché stai chiedendo? Hai davvero provato a fare semplici letture per vedere quanto velocemente Python sarà? –
A meno che tu non sia sposato con Python, potresti star meglio usando un linguaggio di statistiche dedicato come R - vedi http://www.r-project.org. –
Di solito le righe e le righe sono sinonimi quando si parla di tabelle. Immagino tu intenda 40 colonne? –