Sto avendo un sacco di problemi nel trasferire i dati dal maiale e in un CSV che posso usare in Excel o SQL (o R o SPSS ecc. Ecc.) Senza molta manipolazione ...Esportazione da maiale a CSV
ho provato con la seguente funzione:
STORE pig_object INTO '/Users/Name/Folder/pig_object.csv'
USING CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
crea la cartella con lo stesso nome con un sacco di # file part-m-0000. Posso in seguito unirmi a tutti usando cat part *> nomefile.csv ma non c'è intestazione che significa che devo inserirla manualmente.
Ho letto che PigStorageSchema dovrebbe creare un altro bit con un'intestazione ma non sembra funzionare affatto, ad esempio, ottengo lo stesso risultato come se fosse appena memorizzato, nessun file di intestazione: STORE pig_object INTO '/ Users/Name/Folder/pig_object' UTILIZZO org.apache.pig.piggybank.storage.PigStorageSchema();
(l'ho provato sia in modalità locale che in versione mappa).
Esiste un modo per estrarre i dati da Pig in un semplice file CSV senza questi passaggi multipli?
Qualsiasi aiuto sarebbe molto apprezzato!
Grazie molto per la vostra assistenza, Lorand. Chiamare i comandi della shell pulisce un po 'le cose. Tuttavia, l'argomento -schema non crea i file .pig_header o .pig_schema durante l'esecuzione. Ho provato a utilizzare PigStorage e PigStorageSchema. Sto eseguendo Pig 0.10.0. – Saxivore
Ciao amico, oltre a questo ... il file .pig_header _è stato creato ma era nascosto e non riuscivo a vederlo (mi sto ancora abituando a lavorare con le shell). Quindi, ho una soluzione che può essere fatta all'interno di uno script che è fantastico. Grazie! – Saxivore
@Saxivore Controlla lo schema di 'pig_object'. Se non ce n'è uno non verrà creato alcun file di intestazione e schema. Hai bisogno di ulteriore aiuto con questa domanda? –