2011-11-29 19 views
9

Sto cercando di ottenere una buona ricerca della lingua naturale andando in un sito Web e cercando di comprendere i vantaggi di Apache Solr vs Xapian. Xapian sembra più facile da configurare. Entrambi offrono buone ricerche in termini di lingua naturale? Qualsiasi comprensione apprezzata.Xapian vs Apache Solr

+3

questo potrebbe essere utile: http://stackoverflow.com/questions/2488793/solr-vs-xapian-which-one-gived-you-the-more-meaningful-results – javanna

+1

Come si definisce "ricerca della lingua naturale "? È un'interazione simile a Apple Siri, ad es. "Trovami ...", "Cos'è ..." e così via ...? – Mikos

risposta

7

Xapian è più simile a Lucene, una libreria che si integra con l'applicazione. Se hai un'applicazione C++, Xapian potrebbe essere una corrispondenza migliore. Se hai un'applicazione Java, Lucene è quasi certamente la scelta migliore.

Se si desidera un server di ricerca, quindi confrontare Omega (costruito su Xapian) a Solr (costruito su Lucene). Non ho usato Omega o Xapian, ma Solr ha alcune caratteristiche da cui sono venuto a dipendere, specialmente le catene di analisi per campo. Questa è una brillante idea, e una che vorrei aver pensato quando stavo lavorando su Ultraseek.

È abbastanza semplice estendere la catena di analisi Solr con la propria classe Java. Mi aspetto che sarebbe più difficile in C++ con Omega/Xapian.

I due motori utilizzano diversi modelli di rilevanza sottostanti. Xapian è un motore probabilistico, Lucene è un motore spaziale vettoriale. Ho visto entrambi i modelli sintonizzati per ottenere buoni risultati, quindi potrebbe non essere un buon motivo per decidere.

La comunità Solr/Lucene è grande e molto utile.