2012-01-07 14 views
8

Sto iniziando a imparare a fare analisi dei dati in Python.Funzionalità di .rdata simili in Python?

In R, è possibile caricare i dati in memoria, quindi salvare le variabili in un file .rdata.

Sto provando a creare un "progetto" di analisi, in modo che possa caricare i dati, archiviare gli script, quindi salvare l'output in modo che possa richiamarlo nel caso sia necessario.

Esiste una funzione equivalente in Python?

Grazie

risposta

11

Quello che stai cercando è la serializzazione binaria. La funzionalità più notevole per questo in Python è pickle. Se hai alcune strutture di dati scientifici standard, puoi invece guardare HDF5. JSON funziona anche per molti oggetti, ma non è una serializzazione binaria, è basata su testo.

Se si espandono le opzioni, ci sono anche molte altre opzioni di serializzazione. Come Google Protocol Buffers (lo sviluppatore di Rprotobuf è il rispondente di livello superiore per il tag su SO), Avro, Thrift e altro.

Anche se ci sono opzioni di serializzazione generici, come ad esempio pickle e .Rdat, un attento esame del vostro utilizzo sarà utile per fare I O veloce e adatta alle proprie necessità, soprattutto se avete bisogno di accesso casuale, la portabilità, accesso parallelo, strumento/riutilizzo, ecc. Per esempio, ora tendo ad evitare lo .Rdat per oggetti di grandi dimensioni.

Problemi correlati