Ho creato una tabella alveare attraverso una sessione interattiva Elastic MapReduce e popolato da un file CSV come questo: CREATE TABLE csvimport(id BIGINT, time STRING, log STRING)
ROW FORMAT DELIMI
Sto tentando di eseguire il mio script Pig (che utilizza le UDF) su Amazon's Elastic Map Reduce. Ho bisogno di usare alcuni file statici all'interno delle mie UDF. faccio qualcosa come questo nel mio
Sto analizzando i log di accesso generati da Apache, Nginx, Darwin (server di streaming video) e aggregando le statistiche per ogni file consegnato per data/referente/useragent. Tonnellate di registri