2013-04-11 10 views
11

Ho provato a seguire lo nutch tutorial ma ho avuto un po 'di problemi con il file schema.xml.Integrazione Apache Nutch e Solr

mi è stato detto al nutch fornito schema per il mio progetto, in sostanza, questo ...

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/ 

Ho schierato il mio file solr in Tomcat e l'errore che ottengo quando vado al cruscotto Solr è

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: 
Plugin init failure for [schema.xml] fieldType "text": 
Plugin init failure for [schema.xml] analyzer/filter: 
Error loading class 'solr.EnglishPorterFilterFactory' 

che si riferisce a questo elemento nel mio file solrconfig.xml (posso commentare questo fuori ma non è sicuro quanto questo sia importante ancora)

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/> 

Ho modificato il mio solrconfig.xml per cercare e comprendeva una serie di file jar che vengono con solr, specificamente

<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" /> 
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" /> 

Ma io non credo che contengono la classe "solr.EnglishPorterFilterFactory" mancante

Qualcuno ha idea del perché questo potrebbe non funzionare o se mi sono perso qualcosa? Io non sono uno sviluppatore Java btw quindi non c'è dubbio che sarà qualcosa di semplice :)

UPDATE Dopo aver scoperto che lo schema ha avuto alcune vecchie classi si fa riferimento ho avuto un altro sguardo allo nutch/conf e TT sembra che esista un file $ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml che sembra funzionare.

non al 100%, se questo è corretto ma hey ...

risposta

12

Sembra EnglishPorterFilterFactory non è più in giro in 4.x. Vedere la nota in it's 3.6.0 documentation:

Deprecated. 
    Use SnowballPorterFilterFactory with language="English" instead 

Un sacco di roba Deprecated andò in 4,0. Farei quello che dice, vedere lo documentation for SnowballPorterFilterFactory.

+4

Utilizzare anche "$ {NUTCH_RUNTIME_HOME} /conf/schema-solr4.xml" anziché la vecchia configurazione – Carlton