2015-05-15 14 views
5

Dalla Guida Spark programmazioneCome configurare il riavvio automatico del driver applicazione su Filati

Per recuperare automaticamente da un errore del driver, l'infrastruttura di distribuzione che viene utilizzato per eseguire l'applicazione di streaming devono monitorare il processo conducente e rilancia il driver se fallisce. Diversi gestori di cluster hanno diversi strumenti per raggiungere questo obiettivo.

Spark STANDALON

  • Spark Standalone - Un driver applicazione Spark può essere presentata per l'esecuzione all'interno del cluster Spark Standalone (vedi modalità di implementare cluster), vale a dire, il conducente applicazione stessa gira su un dei nodi worker. Inoltre, il gestore cluster autonomo può essere istruito per supervisionare il driver e riavviarlo se il driver non riesce a causa di un codice di uscita diverso da zero o a causa di un errore del nodo su cui è in esecuzione il driver. Vedi la modalità cluster e supervisiona nella guida Spark Standalone per maggiori dettagli.
  • YARN - Yarn supporta un meccanismo simile per il riavvio automatico di un'applicazione. Si prega di fare riferimento alla documentazione del FILATO per maggiori dettagli. ....

    Così, la domanda è come sostenere il riavvio automatico per Spark streaming su Filati.

Grazie e cordiali saluti,

Tao

+0

Non sembra possibile in FILATO? https://github.com/apache/spark/blob/master/core/src/main/scala/org/apache/spark/deploy/SparkSubmit.scala#L462-463 –

+0

Sì, Spark Submit non funziona per YARN. Ma la YARN ha il suo meccanismo che può mantenerlo. –

+0

Quindi ... che cos'è questo meccanismo ...? – JoeC

risposta

1

Quello che state cercando è l'insieme di istruzioni per lanciare la vostra applicazione in filato "modalità cluster": https://spark.apache.org/docs/latest/running-on-yarn.html

Ciò significa che l'applicazione del driver viene eseguita sul cluster su YARN (non sul computer locale). Come tale può essere riavviato da YARN se fallisce.

+1

Potresti chiarire cosa intendevi per set di istruzioni? Non riesco ancora a capire cosa devo fare per riprovare automaticamente. – KangarooWest

Problemi correlati