Sto provando a impostare il numero di attività della mappa da eseguire in ambiente hadoop 0.20.Come impostare il numero di attività della mappa in hadoop 0.20?
Sto usando la vecchia api.
Qui ci sono le opzioni che ho provato finora:
conf.set("mapred.tasktracker.map.tasks.maximum", "5");
conf.set("mapred.map.tasks", "10");
conf.set("mapred.map.tasksperslot", "5");
conf.set("mapred.tasktracker.map", "5");
conf.set("mapred.map.parallel.copies", "5");
con tutte quelle in poi, il numero di attività mappa in esecuzione parallelamente rimane 2.
Quali sono le opzioni corrette per impostare a ottenere il numero di mapper in parallelo fino a 5?
Sareste in grado di fornire uno script di configurazione corretto per EMR? –
cosa intendi con uno script di configurazione per EMR? Hai bisogno di maggiori dettagli. –
all'avvio del lavoro Elastic Mapreduce, esiste la possibilità di eseguire le azioni Bootstrap prima dell'avvio di hadoop. Credo che questo possa essere usato per impostare il numero di mapper, ma io so dove –