Ho pubblicato questo confronto su reddit. Rapidamente un praticante RedShift a lungo termine è venuto a commentare le mie dichiarazioni. Si prega di vedere https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e per la conversazione completa.
Dimensionamento cluster:
- Redshift vi chiederà di scegliere un numero di CPU, RAM, HD, ecc e per accenderli.
- BigQuery non si preoccupa. Usalo quando vuoi, senza bisogno di provisioning.
costi orari in cui non fare nulla:
- Redshift vi chiederà di pagare per ogni ora di ognuno di questi server che eseguono, anche quando si sta facendo nulla.
- Quando inattivo BigQuery addebita solo $ 0,02 al mese per GB memorizzati. 2 centesimi al mese per GB, il gioco è fatto.
velocità di query:
- prestazioni Redshift è limitata dalla quantità di CPU si sta pagando per
- BigQuery porta trasparente in quante più risorse necessarie per eseguire la query in pochi secondi.
indicizzazione:
- Redshift vi chiederà di indice (correzione: distribuire i) i vostri dati sotto determinati criteri, e sarete solo in grado di eseguire le query rapide sulla base di questo indice.
- BigQuery non ha indici. Ogni operazione è veloce.
Aspirazione:
- Redshift richiede una manutenzione periodica e operazioni 'vuoto' che durano ore. Stai pagando per ognuna di queste ore del server.
- BigQuery no. Dimenticatevi di passare l'aspirapolvere.
partizionamento dei dati e la distribuzione:
- Redshift richiede di pensare a come distribuire i dati all'interno dei server per mantenere le prestazioni fino - ottimizzazione che funziona solo per determinate query.
- BigQuery no. Esegui semplicemente qualsiasi query tu voglia.
streaming di dati in tempo reale: (?)
- impossibile con Redshift.
- BigQuery gestisce facilmente l'importazione di fino a 100.000 righe al secondo per tabella.
Crescere cluster:
- Se si dispone di più dati, o più utenti simultanei di scaling up saranno dolorose con Redshift.
- BigQuery funzionerà.
zona Multi:
- Volete un Redshift multizona per la disponibilità e l'integrità dei dati? Doloroso.
- BigQuery è multi-zonato per impostazione predefinita.
Per provare BigQuery non è necessario disporre di una carta di credito o di un orario di configurazione. Provalo (quick instructions to try BigQuery).
Quando si è pronti a inserire i propri dati in BigQuery, è sufficiente copiare i registri separati di nuova linea JSON da Google Cloud Storage e importarli.
Vedere questo in guida approfondita ai prezzi data warehouse sulla nuvola: Understanding Cloud Pricing Part 3.2 - More Data Warehouses
fonte
2015-09-08 19:11:43
Prova quorum, la sua domanda è più adatto lì ... –
un'occhiata a http://www.quora.com/How -good-is-Googles-Big-Query-come-rispetto-a-Amazons-Red-Shift –
Naturalmente ho guardato lì, ho pensato che avrei potuto ottenere un'altra prospettiva dal punto di vista dello sviluppo e dell'integrazione pura. Grazie comunque. – user2339344