Sono nuovo di Hadoop e ho appena iniziato a lavorare su Hive, ho capito che fornisce un linguaggio di query per elaborare i dati in HDFS. Con HiveQl
possiamo creare tabelle e caricare dati da HDFS.Dove si trova la sua tabella?
Quindi la mia domanda è: dove sono memorizzate quelle tabelle? Specificamente se abbiamo un file da 100 GB nel nostro HDFS e vogliamo fare una tabella alveare da quei dati quale sarà la dimensione di quella tabella e dove è memorizzata?
Se la mia comprensione di questo concetto è sbagliato per favore correggetemi ..
Cosa intendi con "caricare l'intero tavolo in memoria e mapparlo nel suo meta-store"? Hive non fa nulla di simile quando crei una tabella gestita. –
Quindi, che cosa sta veramente saltando lì mentre cariciamo i dati in una tabella alveare? – talin
@JeremyBeard Se la mia semantica è sbagliata, non esitate a modificare il post. Se l'intero concetto è sbagliato mi piacerebbe molto sapere dove la mia comprensione non è corretta, quindi ti incoraggio a inviare una risposta – mlegge