Qualcuno può spiegare come funziona MapReduce con Cassandra .6? Ho letto l'esempio di conteggio delle parole, ma non seguo esattamente ciò che sta accadendo sul lato di Cassandra contro il termine "cliente".Come usare la mappa di Cassandra Ridurre con o senza maiale?
https://svn.apache.org/repos/asf/cassandra/trunk/contrib/word_count/
Per esempio, diciamo che sto usando Python e Pycassa, come vorrei caricare in una nuova mappa ridurre la funzione, e poi lo chiamano? La mia mappa riduce la funzione deve essere java installata sul server cassandra? In tal caso, come posso chiamarlo da Pycassa?
C'è anche una menzione di Pig che semplifica tutto, ma io sono un noob completo Hadoop, quindi non è stato di grande aiuto.
La tua risposta può usare Risparmio o qualsiasi altra cosa, ho appena menzionato Pycassa per indicare il lato client. Sto solo cercando di capire la differenza tra ciò che viene eseguito nel cluster Cassandra e il server effettivo che effettua le richieste.
Quindi i nodi Cassandra non stanno riducendo la mappa, ovunque sia in esecuzione Java? – UltimateBrent
Sì, i jobtracker Hadoop eseguono i lavori m/r. – jbellis
quindi non è il punto di mappa ridurre che è distribuito? Se non viene eseguito sui nodi Cassandra, qual è il punto? – UltimateBrent