Sto avendo seguente struttura di directory in HDFS già,Verificando directory in HDFS esiste o no
/analysis/alertData/logs/YEAR/MONTH/DATE/HOURS
che è dati è in arrivo su base houly e memorizzati in formato anno/mese/giorno/ora.
Ho scritto uno script di shell in cui sto passando sentiero fino
"/analysis/alertData/logs" (this will vary depending on what product of data i am handling)
poi shell script di passare attraverso le/mese/data cartelle anno/ora e tornare il più recente percorso.
Ad esempio:
Directories present in HDFS has following structure:
/analysis/alertData/logs/2014/10/22/01
/analysis/alertData/logs/2013/5/14/04
shell script is given path till : " /analysis/alertData/logs "
it outputs most recent directory : /analysis/alertData/logs/2014/10/22/01
La mia domanda è qui è come posso convalidare se HDFS percorso della directory passare a sborsare script è valido o meno. Diciamo che passo un percorso errato come input o percorso che non esiste così come gestirlo nello script di shell.
Esempio strada sbagliata può essere:
wrong path : /analysis/alertData (correct path : /analysis/alertData/logs/)
wrong path : /abc/xyz/ (path does not exit in HDFS)
Ho provato ad utilizzare Hadoop dfs-test z/-d/-e opzioni non hanno lavorato per me. Qualsiasi suggerimento per questo.
NOTA: Non pubblicare il mio codice originale qui, poiché la soluzione al mio problema non dipende da esso.
Grazie in anticipo.