Sto tentando di abilitare l'input errato saltando sui miei lavori Amazon Elastic MapReduce. Sto seguendo la meravigliosa ricetta descritto qui:Impostazione parametri hadoop con boto?
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
Il link qui sopra dice che ho bisogno di impostare in qualche modo i seguenti parametri di configurazione su un lavoro EMR:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
Come faccio a impostare questi (e altri) parametri mapred.XXX su un JobFlow usando Boto?
Grazie! Questo ha funzionato per me. Funziona a volte quando si specificano gli stessi parametri con ['-D', '...'] per lo stesso set di valori con un "passo" anziché come un bootstrap, ma l'aggiunta di questo passo bootstrap sembra rendere questo proiettile prova. – Suman