Ho letto alcuni documenti su hadoop e ho visto risultati impressionanti. Ottengo l'immagine più grande, ma sto trovando difficile se si adatta al nostro setup. Questione di programmazione isnt legato, ma io sono ansioso di chiedere il parere di persone che attualmente lavorano con Hadoop e come si adatterebbe nostra messa a punto:domanda principianti hadoop
- Usiamo Oracle per backend
- Java (Struts2/Servlet/iBatis) per frontend
- Ogni notte riceviamo dati che devono essere riassunti. questo funziona come un processo batch (richiede 5 ore)
Stiamo cercando un modo per ridurre quelle 5 ore a un tempo più breve.
Dove si adatterebbe questa immagine? Possiamo ancora continuare a utilizzare Oracle anche dopo hadoop?
Che volume di dati [GB o TB] e che tipo di riassunto? –
sqoop è un buon strumento se hai bisogno di dati da Oracle per essere importati in hadoop – wlk