Se qualcuno crea un database su un altro database, come ad esempio Twitter, il database eredita le limitazioni e le inefficienze del database sottostante?I database grafici possono distribuire i dati in modo efficiente attraverso i nodi?
Sono specificamente interessato a titan db (http://thinkaurelius.com) a causa della loro pretesa di supportare la divisione del set di dati in modo efficiente attraverso i nodi.
Sostengono di supportare la distribuzione di dati tra i nodi, a causa dell'efficienza di cassandra. Tuttavia, neo4j afferma che la ragione per cui non distribuiscono i dati tra i nodi, ma piuttosto duplica l'intero set di dati su ogni nodo, è perché qualsiasi attraversamento del grafo che lascia un nodo e quindi deve spostarsi attraverso una rete ethernet, è troppo lento per essere pratico.
Poiché cassandra non è a conoscenza del grafico, non può ottimizzare per mantenere gli attraversamenti grafici su un nodo. Pertanto, la maggior parte degli attraversamenti di grafici sarà oltre i confini dei nodi.
I titani sostengono di scalare in modo efficiente attraverso i nodi vero?
Sembra che Titan supporti qualsiasi tipo di grafico, a causa del fatto che cassandra (presumibilmente) non sa nulla del grafico - solo i dati grezzi. Purtroppo non ho alcuni server da utilizzare per i test. Non penso che un benchmark su 5 VM in esecuzione sullo stesso hard disk, con una rete interna sarà un modo equo per testare questo. –