Quando si crea una tabella esterna a Hive (su Hadoop), con un percorso di origine Amazon S3 sono i dati trasferiti al Hadoop HDFS locale:Quando si crea una tabella esterna in Hive con una posizione S3, i dati vengono trasferiti?
- creazione tabella esterna
- quando quaderni (lavori MR) sono eseguire sul tavolo esterno
- mai (nessun dato viene mai trasferito) e i lavori MR leggono dati S3.
Quali sono i costi sostenuti qui per le letture S3? C'è un unico costo per il trasferimento dei dati su HDFS o non ci sono costi di trasferimento dati, ma quando il lavoro MapReduce creato da Hive viene eseguito su questa tabella esterna vengono sostenuti i costi di lettura.
Una definizione tabella esterna esempio potrebbe essere:
CREATE EXTERNAL TABLE mydata (key STRING, value INT)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '='
LOCATION 's3n://mys3bucket/';
(supponendo che intendiate un costo finanziario) Non penso che vi sia addebitato alcun costo per i trasferimenti tra S3 ed EC2 nella stessa regione AWS http://aws.amazon.com/s3/pricing/ –