Ho iniziato a lavorare con nutch e solr e ho un problema con l'integrazione di Solr con Nutch. Ho seguito questo tutorial: http://wiki.apache.org/nutch/NutchTutorial e dopo l'uso: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5
nutch mostra un messaggio:Errore durante l'indicizzazione nei dati solr scansionati dal nutch
java.io.IOException: Job failed!
e solr sta mostrando:
SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'
ho pensato che il motivo potrebbe essere un campo mancante 'host' in $ SOLR_HOME/example/solr/conf/schema.xml ma è lì. Sarei molto grato per il vostro aiuto.
Hai copiato lo schema di Nutch in SOLR? cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/example/solr/conf/ –
sì, l'ho copiato. – user1831647
Verificare se l'host è definito nello schema. Stop Solr. Rimuovi la directory dei dati. Inizia Solr. Riprova. –