2013-08-23 18 views
13

ciao volevo sapere la differenza fondamentale tra jobconf e lavoro oggetti, attualmente Sto presentando il mio lavoro come questoqual è la differenza fondamentale tra jobconf e job?

JobClient.runJob(jobconf); 

ho visto altro modo di presentare i lavori come questo

Configuration conf = getConf(); 
Job job = new Job(conf, "secondary sort"); 
job.waitForCompletion(true);  
return 0; 

e come può ho specificato la classe sortcomparator per il lavoro usando jobconf?

qualcuno può spiegarmi questo concetto?

risposta

20

In breve: JobConf e tutto il resto del pacchetto org.apache.hadoop.mapred fa parte del vecchio API utilizzata per scrivere lavori Hadoop, Job e tutto nel pacchetto org.apache.hadoop.mapreduce fa parte della nuova ed preferita API per scrivere lavori Hadoop. Entrambe le API forniscono generalmente funzionalità core equivalenti.

Se non si è principianti di hadoop, è sufficiente iniziare a utilizzare la nuova API (ad esempio Job e Configuration anziché JobConf). Assicurati di non importare nulla dal pacchetto mapred. Quando trovi esempi su Internet utilizzando la vecchia API, puoi utilizzare this presentation o this guide per tradurlo nella nuova API.

3

Nella vecchia configurazione del processo API viene eseguito dall'oggetto JobConf. Nella nuova API, la configurazione del lavoro viene eseguita tramite un oggetto di configurazione.

Il controllo del lavoro viene eseguito tramite la classe Job nella nuova API, anziché il vecchio JobClient , che non esiste più nella nuova API.

Problemi correlati