Ho appena scoperto che utilizzando Map elastico di Amazon Ridurre, posso specificare un passo per avere una delle tre scelte ActionOnFailure:Mappa elastica Ridurre: differenza tra CANCEL_AND_WAIT e CONTINUA?
- TERMINATE_JOB_FLOW
- CANCEL_AND_WAIT
- CONTINUA
TERMINATE_JOB_FLOW è l'impostazione predefinita e ovvio: arresta l'intero cluster a causa di un errore nel passaggio.
Qual è la differenza tra CANCEL_AND_WAIT e CONTINUE? Mi sembra che entrambi manterranno il cluster in esecuzione e passeranno semplicemente al passaggio successivo quando viene aggiunto.
Grazie! Tutto ciò ha un senso - è lo stesso per me allora, dato che in boto aggiungo solo nuovi passi dopo il precedente, quindi CANCEL_AND_WAIT e CONTINUE sono gli stessi dal mio punto di vista. – Suman
I * penso * che anche con --stay-alive, TERMINATE_JOB_FLOW è l'opzione predefinita. Ho lanciato diversi cluster stay-alive e terminano tutti quando uno dei passaggi fallisce. – Suman
Non succede così per me, tutti i passaggi aggiunti entrano nello stato 'CANCELLATO' e il cluster è in 'Attesa'. Forse c'è qualcosa che ci manca qui. – Amar