2010-09-21 13 views
11

Sto lavorando su un data warehouse e sto cercando una soluzione ETL che utilizzi Python. Ho giocato con SnapLogic come ETL, ma mi chiedevo se ci fossero altre soluzioni là fuori.ETL con Python

Questo data warehouse è appena iniziato. Non ho ancora portato dati. Sarà facilmente più di 100 concerti con il sottoinsieme iniziale di dati che voglio caricare in esso.

+0

Puoi descrivere le dimensioni di un data warehouse su cui stai lavorando? È un magazzino di vecchia data o è appena iniziato? – eksortso

+0

Dai un'occhiata a panda, petl e altri strumenti etl. –

+0

Perché il requisito "usa Python"? Dovresti scegliere lo strumento migliore per il lavoro. –

risposta

17

Sì. Basta scrivere Python usando un'interfaccia DB-API per il tuo database.

La maggior parte dei programmi ETL offre "linguaggi di alto livello" elaborati o GUI drag-and-drop che non aiutano molto.

Python è altrettanto espressivo e altrettanto facile da utilizzare.

Rifiuta offuscamento. Basta usare semplicemente Python.

Lo facciamo tutti i giorni e siamo molto, molto contenti dei risultati. È semplice, chiaro ed efficace.