Ho bisogno di memorizzare una grande quantità di piccoli oggetti di dati (milioni di righe al mese). Una volta salvati, non cambieranno. Ho bisogno di:Magazzino di dati gratuito - Infobright, Hadoop/Hive o cosa?
- memorizzarli in modo sicuro
- li usano per l'analisi (per lo più tempo-oriented)
- recuperare alcuni dati grezzi di tanto in tanto
- Sarebbe bello se potesse essere utilizzato con JasperReports o BIRT
Il mio primo colpo è stato Infobright Comunità - solo una colonna-oriented, di sola lettura meccanismo di memorizzazione per MySQL
D'altra parte, la gente dice che l'approccio NoSQL potrebbe essere migliore. Hadoop + Hive sembra promettente, ma la documentazione sembra scadente e il numero di versione è inferiore a 1.0.
ho sentito parlare di Hypertable, Pentaho, MongoDB ....
Avete suggerimenti?
(Sì, ho trovato alcuni argomenti qui, ma era o due anni fa)
Edit: Altre soluzioni: MonetDB, InfiniDB, LucidDB - Che cosa ne pensi?
Il numero di versione non è importante. HDFS/Hadoop funzionano bene, ma sono interessanti solo se si hanno diversi nodi per i dati e l'analisi. – Leonidas
Se si desidera un avvio rapido, si consiglia di utilizzare pentaho e un database pentaho supporta. Penso che le risposte di seguito si concentrino maggiormente sull'accesso ai dati, ma nello sviluppo del data warehouse, anche gli strumenti sono importanti. – elprup
@Piotr: Questa è una domanda di due anni senza una risposta. Ho bisogno di una soluzione con le stesse caratteristiche. Cosa hai deciso di usare alla fine? –