Ho un po 'di expirience con Apache Spark e Spark-SQL. Recentemente ho trovato il progetto Apache Drill. Potresti descrivermi quali sono i vantaggi/differenze più significativi tra loro? Ho già letto Fast Hadoop Analytics (Cloudera Impala vs Spark/Shark vs Apache Drill) ma questo argomento non è ancora chiaro per me.Apache Drill vs Spark
9
A
risposta
17
Ecco un articolo mi sono imbattuto in che discute alcune delle tecnologie SQL: http://www.zdnet.com/article/sql-and-hadoop-its-complicated/
Drill è fondamentalmente differente sia l'esperienza dell'utente e l'architettura. Ad esempio:
- Drill è un motore di query senza schema. Ad esempio, è possibile puntarlo in una directory di file di registro JSON o Parquet (nella casella locale, una condivisione NFS, S3, HDFS, MapR-FS, ecc.) Ed eseguire una query. Non è necessario caricare dati, creare e gestire schemi o pre-elaborare i dati.
- Drill utilizza internamente un modello di documento JSON che consente di interrogare i dati di qualsiasi struttura. Molti dati moderni sono complessi, il che significa che un record può contenere strutture e array nidificati, mentre i nomi dei campi possono effettivamente codificare valori quali timestamp o URL di pagine web. Drill consente ai normali strumenti di BI di operare senza problemi su tali dati senza richiedere che i dati vengano appiattiti in anticipo.
- Il drill funziona con una varietà di archivi di dati non relazionali, inclusi i database Hadoop, NoSQL (MongoDB, HBase) e il cloud storage. Verranno aggiunti ulteriori archivi dati.
Drill 1.0 è stato appena rilasciato (19 maggio 2015). Puoi facilmente scaricarlo sul tuo laptop e giocare con esso senza alcuna infrastruttura (Hadoop, NoSQL, ecc.).
Problemi correlati
- 1. Prestazioni di Apache Drill
- 2. Analisi Hadoop veloce (Cloudera Impala vs Spark/Shark vs Apache Drill)
- 3. Apache Spark vs. Apache Storm
- 4. Apache Spark vs Apache Ignite
- 5. Apache Phoenix vs Hive-Spark
- 6. Come utilizzare Apache Drill con Cassandra
- 7. Apache Spark java.lang.ClassNotFoundException
- 8. Streaming di Apache Spark vs Spring XD Stream
- 9. UIViewController: rilevamento drill-down e drill-up
- 10. Apache Flink vs Twitter Airone?
- 11. Apache Flink vs Apache Spark come piattaforme per l'apprendimento automatico su larga scala?
- 12. Apache Spark - MlLib - Filtro collaborativo
- 13. Passare argomenti a Apache Spark
- 14. Apache Spark Stderr e Stdout
- 15. Utilizzando R in Apache Spark
- 16. Apache Spark: distinto non funziona?
- 17. Chiavi primarie con Apache Spark
- 18. Lambda Architecture con Apache Spark
- 19. Apache Spark ALS raccomandazioni approccio
- 20. Apache Spark on EC2 "Killed"
- 21. Qual è la differenza tra Apache Spark e Apache Flink?
- 22. Come installare Apache Zeppelin sul cluster autonomo Apache Spark
- 23. Flusso di lavoro dell'app Apache Spark
- 24. Apache Spark Lambda Expression - Serialization Issue
- 25. Apache Spark: l'operazione unione non viene eseguita
- 26. uguaglianza della classe caso in Apache Spark
- 27. Salva Apache Spark modello mllib in pitone
- 28. Uso di reduceByKey in Apache Spark (Scala)
- 29. idea sbt java.lang.NoClassDefFoundError: org/apache/spark/SparkConf
- 30. Apache filtro Spark RDD in due RDDs
http://www.javacodegeeks.com/2015/12/apache-spark-vs-apache-drill.html – TechDog