Sto utilizzando la versione di Hive di Cloudera e sto provando a creare una tabella esterna su un file csv che contiene i nomi di colonna nella prima colonna. Ecco il codice che sto usando per farlo.Tabella esterna alveare Salta la prima riga
CREATE EXTERNAL TABLE Test (
RecordId int,
FirstName string,
LastName string
)
ROW FORMAT serde 'com.bizo.hive.serde.csv.CSVSerde'
WITH SerDeProperties (
"separatorChar" = ","
)
STORED AS TEXTFILE
LOCATION '/user/File.csv'
dati di esempio
RecordId,FirstName,LastName
1,"John","Doe"
2,"Jane","Doe"
Qualcuno mi può aiutare con il modo di saltare la prima riga o devo aggiungere una tappa intermedia?
Ho appena iniziato a giocare con Hive me stesso e da quello che posso dire, il lavoro di SerDe solo su una base riga per riga, quindi potrebbe non essere possibile senza qualche intermedia. Se riesco a pensare a qualcosa, lo posterò qui. Sono anche interessato a una soluzione. – nolanpro