2013-07-07 20 views
5

È possibile configurare Mahout per recuperare i dati di input da un cluster Cassandra mentre si esegue un lavoro di Recommender su Hadoop?Scalare Cassandra e Mahout con Hadoop

Ho trovato alcune risorse su questo argomento - vedere http://www.acunu.com/2/post/2011/08/scaling-up-cassandra-and-mahout-with-hadoop.html, ma le indicazioni descritte non sembrano funzionare (provato sia su mahout-0.6 che su mahout-0.7). Per istanza la variabile itemIDIndexPath non sembra esistere nella classe RecommenderJob né nelle classi astratte che estende.

risposta

0

Ho provato a eseguire query Pig/Hive contro Cassandra e l'ho trovato piuttosto instabile sotto carico. Il problema è che il percorso di lettura di Cassandra è piuttosto inefficiente, specialmente su Thrift. Raccomanderei di scaricare i dati su HDFS come fase intermedia e processarli da lì

Problemi correlati