2010-08-21 13 views
5

Sto usando OpenLink Virtuoso come archivio RDF da un po 'di tempo e sebbene sia grandioso con i dati di grandi dimensioni, non sono soddisfatto delle prestazioni del traversal grafico che utilizzano SPARQL. Recentemente ho sentito parlare molto della performance di Traversal di Neo4j e ho pensato che valesse la pena provare. Quindi, al fine di avere un grande archivio RDF con buone prestazioni trasversali, è meglio passare a Neo4j?Neo4j vs OpenLink Virtuoso

Non ho idea delle prestazioni di Neo4j con dati di grandi dimensioni e, beh, la parte RDF/SPARQL di Neo4j non sembra così matura. Grazie per il tuo tempo.

+0

consulta questo esempio strisciare transitiva sulla base di SPARQL. Il backend ha 29 miliardi + tripli. Link: http://lod.openlinksw.com/b3s/search.vsp?q=6 –

risposta

4

Virtuoso "Transitivity in SPARQL" sarebbe il metodo consigliato per attraversare il grafico. Abbiamo anche un tutorial on Transitivity che fornisce alcune query di esempio. Sono inoltre disponibili query di esempio dal vivo contro le nostre istanze e URIBurner (500+ million triples). Il nostro post sul blog Virtuoso Transitivity and Graphs for SQL Sarebbe anche una lettura interessante ...

(Risposto da Hugh Williams, OpenLink Software)

+0

Grazie mille, ho intenzione di saltare su quello. E mi viene in mente un'altra domanda: in che modo le query su cURL riducono le prestazioni rispetto a ODBC o JDBC? – parsa

0

Potete per favore fornire maggiori informazioni nel problema di prestazioni del traversal grafico incontrato con Virtuoso, in modo tale da poter offrire un consiglio su come migliorarlo. Si prega di fornire anche la versione di Virtuoso utilizzata?

migliori saluti

Hugh Williams

Software

OpenLink

+1

Ciao Hugh, Sto usando 6.01.3127 (versione Opensource) su una scatola Ubuntu. In realtà, la mia osservazione con Virtuoso non è basata sui numeri, ma solo sul mio senso personale. Il grafico è stato caricato con il dataset DBPedia più recente (3.5.1) e quindi le query sono state eseguite sull'endpoint SPARQL tramite binding cURL in PHP (localmente). Ho implementato una semplicistica e classica ricerca di ampiezza con l'obiettivo di trovare la lunghezza del percorso più breve tra 2 nodi. Quindi cosa suggerisci? Grazie per il tuo tempo. – parsa

+1

/@ parsa: per riferimento futuro, le risposte SO non sono pensate per funzionare come forum di discussione. –

0

mi piacerebbe vedere il codice sorgente e dei dati e dei file di configurazione prima di fornire eventuali suggerimenti. Non è raro avere una differenza di prestazioni di 500 volte a causa di trivia come un indice mancante o un'impostazione di configurazione. Potresti fornire maggiori dettagli, magari tramite Virtuoso Users mail list?