Sto lavorando alla creazione di un cluster hadoop in cui i nodi sono tutti abbastanza eterogenei, cioè ognuno ha un diverso numero di core. Attualmente ho modificare manualmente il mapred-site.xml
su ogni nodo di compilare {cores}
:Imposta automaticamente il numero massimo di attività mappa per nodo sul numero di core?
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>{cores}</value>
</property>
C'è un modo più semplice per questo quando aggiungo nuovi nodi? La maggior parte degli altri valori sono di default e le attività di mappa massime sono l'unica cosa che cambia da nodo a nodo.
Grazie. Sapevo di poter eseguire una sorta di script per farlo, ma speravo in una sorta di variabile hadoop che potrei inserire. O almeno un valore predefinito più ragionevole di 2. – job
Puoi modificare il codice sorgente di TaskTracker per interpretare un formula in mapred-site.xml ('$ CORES/2-1' per esempio) - ma preferibilmente dovresti trovare anche un modo Java per determinare il numero di core. –