2015-03-17 13 views

risposta

1

Suppongo che entrambi facciano lo stesso tranne quando si avvia il server Hive Thrift dalla scintilla, aggiunge un altro servizio CLI allo thrift server che dovrebbe aggiungere il contesto SQL spark all'API di risparmio.

2

Hiveserver2 è il motore sql di hive che può utilizzare map reduction, spark o tez come motore di esecuzione. Hive crea il piano di esecuzione e quindi richiama il motore di esecuzione per eseguire la query. L'ottimizzazione è fatta dall'alveare.

Sono un utente molto accattivante, ma volevo che l'hive fosse disponibile per eseguire query ad hoc tramite la tonalità. Dopo alcune ricerche posso vedere che hive 1.2.1 supporta fino a scintilla 1.4.1 come motore di esecuzione. hive 2 ha una dipendenza da spark 1.5 ma non ho provato ad eseguirlo con 1.5 o 1.6.

Il server sparkward può sostituire il server hive 2 e utilizza spark per eseguire effettivamente la query e fare il proprio piano di esecuzione (che può o non può essere migliore di hive), ma consente di accedere ad altre fonti di scintille come rdds, file di testo ecc. Naturalmente, è possibile eseguire il server di risparmio con l'ultima versione di spark.

Problemi correlati