2015-05-05 21 views
10

Sto usando il nutch 2.3. Tutti i lavori vengono eseguiti uno dopo l'altro, ovvero il primo generatore, il recupero, l'analisi, l'indice, ecc. Voglio eseguire alcuni lavori contemporaneamente. So che alcuni lavori non possono essere eseguiti in parallelo ma altri possono, ad esempio, analizzare il lavoro, dbupdate, indexjob deve essere eseguito con fetch.Come eseguire apache nutch diversi processi in modo parallelo

È possibile? Il mio obiettivo principale è quello di eseguire il lavoro fetcher tutto il tempo. Suppongo che possiamo farlo con timestamp diversi. Qualcuno può guidarmi nel modo giusto?

+0

Potresti usare l'hasdoop con il nutch. –

risposta

5

Se si esegue il check-out del server Web di Nutch, si scoprirà che è possibile eseguire più processi di ricerca per indicizzazione in parallelo. Si consiglia di verificare il codice sorgente di Nutch 2.3 per webapp [NutchUiServer]. Spero che questo ti aiuti.

Problemi correlati