Sto provando a caricare i dati da un file csv in cui i valori sono racchiusi tra virgolette "" "e tab separati" \ t ". Ma quando provo a caricarlo in hive non viene generato alcun errore e i dati sono . caricato senza alcun errore, ma penso che tutti i dati sono sempre caricato in una singola colonna e la maggior parte dei valori che mostrando come NULL di seguito è la mia istruzione CREATE tABLECome caricare i dati CSV con racchiusi tra virgolette e separati da tabulazione nella tabella HIVE?
CREATE TABLE example
(
organization STRING,
order BIGINT,
created_on TIMESTAMP,
issue_date TIMESTAMP,
qty INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
ESCAPED BY '"'
STORED AS TEXTFILE;
campione del file di input, -.
"Organization" "Order" "Created on" "issue_date" "qty"
"GB" "111223" "2015/02/06 00:00:00" "2015/05/15 00:00:00" "5"
"UK" "1110" "2015/05/06 00:00:00" "2015/06/1 00:00:00" "51"
e Carica istruzione per inserire dati nella tabella alveare.
LOAD DATA INPATH '/user/example.csv' OVERWRITE INTO TABLE example
Quale potrebbe essere il problema e come ignorare l'intestazione del file. e se tolgo escape dal '"' da creare dichiarazione suo carico in rispettive colonne, ma tutti i valori sono racchiusi tra virgolette. Come posso rimuovere le virgolette dai valori e ignoro intestazione del file?
Hai in esecuzione HUE? In questo caso potresti fare la webapp del gestore metastore. – maxymoo