Voglio creare una tabella Hive in cui i file di testo di input vengono spostati su più sottodirectory in hdf. Così esempio ho in HDFS:Hive: creazione di tabelle con più file con più directory
/testdata/user/Jan/part-0001
/testdata/user/Feb/part-0001
/testdata/user/Mar/part-0001
and so on...
Se voglio creare un utente tavolo in alveare, ma hanno che sia in grado di attraversare le sottodirectory di utente, può che essere fatto? Ho provato qualcosa di simile, ma non funziona;
CREATE EXTERNAL TABLE users (id int, name string)
STORED AS TEXTFILE LOCATION '/testdata/user/*'
ho pensato di aggiungere il carattere jolly avrebbe funzionato, ma non lo fa. Quando ho provato a non utilizzare il carattere jolly, non funziona ancora. Tuttavia, se copio i file nella directory principale dell'utente, funziona. Non c'è modo per Hive di attraversare le directory dei bambini e prendere quei file?
Questo non ha funzionato. In realtà, avrei dovuto dire che sto eseguendo CDH3u1 adesso. – user706794
Definire "Non ha funzionato". Vorrei anche ricordare che sarebbe necessario cambiare i nomi delle directory in mese = gennaio ecc ... –