2011-02-07 12 views
5

Voglio fare alcuni calcoli con hadoop e mahout sulla mia macchina quad core, quindi sto usando hadoop in modalità pseudo-distribuita.Gestione di hdf in modalità hasdoop pseudo-distribuita

Il problema è che lo spazio sul mio root drve è limitato, quindi come posso configurarlo per utilizzare lo spazio disponibile su qualche altro disco rigido esterno.

risposta

6

È possibile configurare il punto in cui hdfs strores i propri dati. Aggiungere il seguente alla conf/HDFS-site.xml:

<property> 
    <name>dfs.data.dir</name> 
    <value>__path_to_where_you_want_to_store_your_data/hdfs/data/</value> 
</property> 
<property> 
    <name>dfs.name.dir</name> 
    <value>__path_to_where_you_want_to_store_your_data/hdfs/name/</value> 
</property> 

Dopo theese cambia dovrete formattare il NameNode:

hadoop namenode -format

+0

ma il Hadoop non si avvia dopo che. Mantiene mostrando che la NameNode è in modalità provvisoria – Pankaj

+0

forse avete anche configurare il dir dfs.name: dfs.name.dir /Users/Helmut/programmieren/HDFS/name/ DFS .data.dir e dfs.name.dir dovrebbero puntare a una posizione sull'unità esterna. Dopo aver modificato questi valori, riformatta il tuo filesystem hdfs con 'hadoop namenode -format' –

+0

Dopo aver eseguito un' hadoop namenode -format', è necessario cancellare qualcosa nel file dfs.name.dir – Leons

Problemi correlati