Io uso il mio log API per estrarre informazioni come:Hbase vs Cassandra: quale è meglio per l'archiviazione dei dati di una volta?
- In questo periodo di tempo quanti sono gli utenti del mio API?
- O in questo periodo di tempo, che tipo di servizi sono chiamati più?
Quasi tutte le informazioni estratte dipendono dal timestamp. In realtà io uso MongoDB e ho aggiunto il timestamp come indice (per 80 GB, la dimensione degli indici è di 12 GB).
Per me è stata consigliata una migrazione verso cassandra o Hbase. E voglio sapere quale è meglio per il mio caso d'uso:
- Analisi per i dati di tempi.
- Sono richieste entrambe buone prestazioni di scrittura e lettura.
- Possibilità di utilizzare hadoop per eseguire l'analisi dei dati.
Grazie per aver condiviso il tuo punto di vista o la tua esperienza.
A seconda del tipo di ambiente in cui si sta lavorando, ottenere DataStax Enterprise potrebbe essere gratuito. – mildewey
È per distribuzione commerciale quindi è pagato. Ma Datastax è indispensabile quando utilizzo Hadoop con Cassandra? – Mouna
Utilizziamo Apache Spark con Apache Cassandra (senza DataStax Enterprise). Mentre dovevo scrivere alcuni script iniziali per l'automazione, far funzionare le cose era abbastanza semplice. DSE fornisce l'integrazione OOB di Hadoop/Solr/Spark/etc., mentre è necessario eseguire lo script di ciò che è necessario per le versioni di apache. Se tutto quello che stai cercando è l'analisi delle serie temporali + query, Spark + Cassandra farà di più del lavoro, mentre non ti richiede di configurare Hadoop. – ashic