2012-02-01 14 views
5

Sono un principiante di Hadoop. Ho letto che HDFS riguarda principalmente "scrivere una volta, leggere ogni volta". Ho un caso d'uso in cui potrei dover apportare modifiche ai file memorizzati in HDFS. Ho cercato se ci sono dei modi per farlo.Aggiornamento di un file HDFS hadoop

La mia domanda è che sarà possibile caricare il file HDFS in HBase, fare le modifiche e salvarlo nuovamente in HDFS e cancellare il file originale. Per favore lasciami se questo è fattibile.

risposta

4

Se è necessario aggiornare i valori in un file, è molto meglio utilizzare HBase. Puoi ancora utilizzare la tabella HBase nei tuoi lavori MR tramite TableInputFormat e TableOutputFormat. Se si desidera aggiungere dati, è possibile utilizzare qualsiasi versione di hadoop che supporti l'aggiunta di hdf come 0.20.205.0.

+0

Grazie Steve. Posso eseguire operazioni di randow nel file hdfs usando hbase o si aggiunge solo? –

+0

È possibile modificare casualmente i record in hbase. –

+0

Steve ho costruito una tabella Hbase in grado su un file HDFS. quando ho provato ad aggiornare i record di Hbase con il semplice comando 'Put' non sono in grado di vedere le modifiche in HDFS? Non dovrebbe essere aggiornato automaticamente? – Ragav