Apache Giraph vs Neo4j: sono gli algoritmi attraversamento attraverso i nodi del tutto diversa nelle tesi due sistemi di elaborazione grafico? Se dovessimo attraversare dire un grafico sociale utilizzando Giraph e Neo4j su dati memorizzati in una singola macchina (non distribuiti), che avrebbe prestazioni migliori e perché?Neo4j vs Apache Giraph nel grafico attraversamento
risposta
Mani giù Neo4j. I calcoli del grafico di Giraph funzionano come lavori Hadoop, perché sono pensati per lavorare su grandi grafici distribuiti. Il sovraccarico di gestione di questi lavori è troppo grande per essere efficiente su un grafico su piccola scala eseguito su un cluster di macchine singole pseudo-distribuito.
Non solo, ma la specialità di Neo4j sono i traversali. Un grande motivo per questo è perché Neo4j memorizza effettivamente le relazioni adiacenti in liste doppiamente collegate nel filesystem. Dai un'occhiata a questo blog:
http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html
Spiega il modo in cui Neo4j ottimizzare il modo in cui memorizzare il grafico, per le operazioni di grafico veloce, come attraversamenti.
- 1. Neo4j o GraphX / Giraph cosa scegliere?
- 2. Algoritmo di attraversamento grafico buono
- 3. Attraversamento grafico con Networkx (Python)
- 4. Neo4j vs OpenLink Virtuoso
- 5. Come eliminare tutte le relazioni nel grafico neo4j?
- 6. Elimina proprietà dal grafico Neo4j
- 7. Neo4j Server vs. Embedded
- 8. neo4j vs mongodb per ricerca spaziale
- 9. Attraversamento grafico efficiente con LINQ - eliminazione della ricorsione
- 10. Neo4j nel cloud
- 11. Differenza tra database grafico: Neo4j e AllegroGraph
- 12. Database grafico in Java (diverso da Neo4J)
- 13. Apache Spark vs. Apache Storm
- 14. Apache Spark vs Apache Ignite
- 15. Esportare il database neo4j nel file json
- 16. Posso usare python con giraph?
- 17. Usa neo4j nel dispositivo Android
- 18. JAXB vs Apache XMLBeans
- 19. comparatore vs Apache BeanComparator
- 20. GWT vs Apache Wicket
- 21. Apache-ssl vs mod_ssl
- 22. Apache Drill vs Spark
- 23. Apache Helix vs YARN
- 24. Xapian vs Apache Solr
- 25. Rilevamento dei cicli nel grafico delle proprietà neo4j utilizzando la cifratura
- 26. HSSFWorkbook vs XSSFWorkbook vs SXSSFWorkbook - Apache POI
- 27. primitive conteggio in Neo4j
- 28. Mapping da ontologia OWL a database grafico Neo4j
- 29. ORM con database grafico come Neo4j in Python
- 30. ACL piramidale senza attraversamento
Sono d'accordo con questa risposta. Neo4j era pensato per l'analisi dei dati in tempo reale, su un insieme di dati di piccole/medie dimensioni (milioni di nodi/relazioni), mentre giraph/pregel era pensato per lavori distribuiti su larga scala, su traversali di dimensioni Internet. – Nicholas