Scalare Cassandra e Mahout con Hadoop

È possibile configurare Mahout per recuperare i dati di input da un cluster Cassandra mentre si esegue un lavoro di Recommender su Hadoop?Scalare Cassandra e Mahout con Hadoop

Ho trovato alcune risorse su questo argomento - vedere http://www.acunu.com/2/post/2011/08/scaling-up-cassandra-and-mahout-with-hadoop.html, ma le indicazioni descritte non sembrano funzionare (provato sia su mahout-0.6 che su mahout-0.7). Per istanza la variabile itemIDIndexPath non sembra esistere nella classe RecommenderJob né nelle classi astratte che estende.

fonte

2013-07-07 Dumitru P.

Ho provato a eseguire query Pig/Hive contro Cassandra e l'ho trovato piuttosto instabile sotto carico. Il problema è che il percorso di lettura di Cassandra è piuttosto inefficiente, specialmente su Thrift. Raccomanderei di scaricare i dati su HDFS come fase intermedia e processarli da lì

fonte

2015-04-23 14:46:40

Scalare Cassandra e Mahout con Hadoop

risposta

Problemi correlati