2013-05-02 8 views
8

Ho bisogno di stampare il risultato del mio hadoop in formato .csv. come faccio? Il mio codice: https://github.com/studhadoop/xml/blob/master/XmlParser11.javaCome posso produrre risultati hadoop in formato csv

devo semplicemente includere csvoutputFormat nel mio codice. Sto usando MapReduce API

myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4 

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit 


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv 

SOLUZIONE

ys mi mancava> in cat

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv 

risposta

12

È possibile utilizzare TextOutputFormat. Il separatore chiave/valore predefinito è un carattere di tabulazione. Puoi cambiare il separatore impostando la proprietà "mapred.textoutputformat.separatorText" nel tuo driver.

conf.set("mapred.textoutputformat.separatorText", ","); 
+0

ho bisogno di aggiungere semplicemente questo codice nel mio autista, ho ragione –

+0

Sì. E dovresti usare "TextOutputFormat". – Rags

+4

Guarda il nome della proprietà che dovrebbe essere "mapred.textoutputformat.separator" non "mapred.textoutputformat.separatorText" – Rags

Problemi correlati