2013-07-15 8 views
5

ho eseguito crawler nutch come da esercitazione nutch http://wiki.apache.org/nutch/NutchTutorial ma quando ho iniziato il caricamento a Solr sto ottenendo questo messaggio vale a dire "Nessun IndexWriters attivato - controllare la configurazione"Nutch messaggio "Nessun IndexWriters attivati" durante il caricamento di Solr

bin/nutch solrindex http://localhost:8983/solr crawl/crawldb/ -dir crawl/segments/ 
Indexer: starting at 2013-07-15 08:09:13 
Indexer: deleting gone documents: false 
Indexer: URL filtering: false 
Indexer: URL normalizing: false 
**No IndexWriters activated - check your configuration** 

Indexer: finished at 2013-07-15 08:09:21, elapsed: 00:00:07 

risposta

7

Assicurarsi che il plug-in indexer-solr sia incluso. Vai al file: conf/nutch-site.xml e nella proprietà plugin.includes aggiungere il plug-in, per esempio:

protocollo http | URLFilter-regex | parse- (html | Tika) | index (di base | ancoraggio) | indexer- solr | scoring-OPIC | urlnormalizer- (passano | regex | base)

Dopo aver aggiunto il plugin l'avvertimento No IndexWriters activated - check your configuration scomparso nel mio caso.

Controllare questa discussione: http://lucene.472066.n3.nabble.com/a-plugin-extending-IndexWriter-td4074353.html

+0

Grazie a @Tryskele ma l'ho già installato. –

+0

E non funziona ... –

+0

In ritardo per la festa ma per chiunque altro come me che si è imbattuto in questo, assicurati di aggiornare il tuo file nutch-site.xml nella cartella runtime/local/conf /, non solo in conf /. – Scott101

0

Non so se questo è ancora un problema, ma ho avuto questo problema e poi si rese conto che il mio src/plugin/build.xml mancava il plugin indexer-solr. L'aggiunta dei seguenti e poi ricompilare nutch fissata per me:

<ant dir="indexer-solr" target="deploy"/>

0

aggiungere la proprietà di seguito in conf/nutch-site.xml per il plugin

<property> 
<name>plugin.includes</name> 
<value>protocol-httpclient|urlfilter-regex|index-(basic|more)|query-(basic|site|url|lang)|indexer-solr|nutch-extensionpoints|protocol-httpclient|urlfilter-regex|parse-(text|html|msexcel|msword|mspowerpoint|pdf)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)protocol-http|urlfilter-regex|parse-(html|tika|metatags)|index-(basic|anchor|more|metadata)</value> 
</property> 

Fammi sapere se risolve il problema .

2

@Tryskele + @ Scott101 ha funzionato per me:

aggiungere plugin.includes proprietà sia /conf/nutch-site.xml e///file locali conf runtime Nutch-site.xml:

<property> 
    <name>plugin.includes</name> 
    <value>protocol-httpclient|urlfilter-regex|index-(basic|more)|query-(basic|site|url|lang)|indexer-solr|nutch-extensionpoints|protocol-httpclient|urlfilter-regex|parse-(text|html|msexcel|msword|mspowerpoint|pdf)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)protocol-http|urlfilter-regex|parse-(html|tika|metatags)|index-(basic|anchor|more|metadata)</value> 
</property> 
Problemi correlati