2016-06-18 20 views
6

Ho lavorato all'aggregazione di dati di streaming, ho trovato 2 strumenti per ottenere lo stesso risultato. Sono druidi e pipelinedb. Ho compreso l'implementazione e l'architettura di entrambi. Ma non riuscivo a trovare un modo per confrontare questi due. Esiste un test di benchmark esistente che sia stato fatto? O se voglio fare un benchmarking oltre alla velocità e alla scalabilità, quali sono tutti i fattori che devo considerare. Qualsiasi idea, collegamento e aiuto sarebbe davvero apprezzabile. Inoltre non condividere la propria esperienza con pipelinedb e druidoConfronto tra druido e pipelinedb

Grazie

+1

Hai trovato qualcosa? Stai cercando la stessa cosa. Con cosa sei andato alla fine e perché? –

risposta

0

UPD:

Dopo aver letto le pagine PipelineDB, mi chiedo solo perché avete bisogno di confrontare queste cose diverse?

Il druido è piuttosto complesso da installare e gestire, richiede diverse dipendenze esterne (come ad esempio zookeeper e hdf/amazon, che devono essere mantenute).

E per quel prezzo si compra le caratteristiche principali di druido: colonna-oriented e distribuiti conservazione e la lavorazione. Ciò implica anche una scalabilità orizzontale della scatola, ed è completamente automatico, non devi neppure pensarci.

Quindi, se non hai bisogno della sua natura distribuita, direi che non hai bisogno di druido.

PRIMA VERSIONE:

non ho alcuna esperienza con pipelinedb (cos'è Google mostra nulla, pls condividere qualche link?), Ma non ho molta esperienza con druido. Quindi vorrei prendere in considerazione (a parte [domanda] velocità e scalabilità): (? Quante righe per sec/min/ora/... può essere inserito )

  1. ingestione di prestazioni consumi
  2. RAM di ingestione (quanta RAM ha bisogno di ingerire con velocità di riferimento?)
  3. livello di compressione (quanti di spazio su disco ha bisogno di uno ora/giorno/mese/... dei dati?)
  4. tolleranza d'errore (cosa succede quando un certo dei componenti falliscono? È fondamentale per la mia azienda?)
  5. Caching (basta tenere a mente)
+0

che google stai usando? pipelinedb è ben referenziato. https://www.pipelinedb.com/ – mathieu

+0

proprio ieri ha mostrato tonnellate di pagine "compra-questo-dominio" –