Sto eseguendo un cluster di test con MRv1 (CDH5) accoppiato con LocalFileSystem e l'unico utente che sono in grado di eseguire processi come è mappato (come mapred è l'utente che avvia i daemon di jobtracker/tasktracker). Quando si inoltrano lavori come qualsiasi altro utente, i lavori non riescono perché il jobtracker/tasktracker non è in grado di trovare job.jar nella directory .staging.I lavori Hadoop falliscono quando vengono inviati da utenti diversi dal filato (MRv2) o mappati (MRv1)
Ho lo stesso identico problema con YARN (MRv2) quando abbinato a LocalFileSystem, ovvero quando si inoltrano lavori da un utente diverso da 'filato', il master dell'applicazione non è in grado di individuare job.jar nella directory .staging.
Dopo aver ispezionato la directory .staging dell'utente che ha inviato il lavoro, ho trovato che job.jar esiste nella directory .staging //, ma le autorizzazioni sulle directory e .staging sono impostate su 700 (drwx ---- -) e quindi l'applicazione master/tasktracker non è in grado di accedere a job.jar e ai file di supporto.
Stiamo eseguendo il cluster di test con LocalFileSystem poiché utilizziamo solo la parte MapReduce del progetto Hadoop abbinata a OCFS nella nostra configurazione di produzione.
Qualsiasi aiuto in questo senso sarebbe immensamente utile.
È possibile avviare il processo PIG o hive nello stesso cluster? –