2012-11-28 17 views
15

Ho letto sull'uso di Solr e Mahout per lo sviluppo di sistemi di raccomandazione.Sistemi di raccomandazione usando Solr e Mahout

Come ho capito, gestisce due diversi problemi.

  1. Dal Solr è un sistema di motore di ricerca + classificazione, è utilizzato principalmente per le raccomandazioni del tipo "più simile a questo" in Drupal - http://jamidwyer.com/d7/node/21.

(o funzione "Related" in StackOverflow)

  1. Nel caso di Mahout, implementa algoritmi di apprendimento automatico, come Collaborative Filtering.It possono essere utilizzati per implementare caratteristiche come suggerimenti in Amazon basato sugli utenti azioni precedenti.

mie domande,

vengono usati per affrontare due problemi diversi (calibro, gli oggetti acquistati)?

Possono essere integrati?

Ho letto che Mahout esegue l'elaborazione offline e la scalabilità. Questo significa che Solr non può essere ridimensionato?

+0

perché hanno votato per la chiusura? Sono sicuro che questa è una domanda di architettura generale a chiunque sia nuovo di Solr e Mahout –

+0

Non è una domanda negativa di per sé, ma non è una buona idea per SO. –

risposta

3

hai ragione si rivolgono a due diversi problemi e finora non ho visto/trovato alcuna integrazione esistente che avrebbe funzionato fuori dalla scatola.

Quello che potresti fare è usare i risultati della classificazione di Mahout per aggiungere ulteriori informazioni ai tuoi documenti indicizzati che possono poi essere usati per potenziare gli scopi.

Per quanto riguarda la tua ultima risposta - Solr può scalare, con la versione 4.0 appena rilasciata può persino scalare meglio di prima. Ma risolve uno scopo diverso e si adatta bene per questo.

La domanda è un po 'aspecifica quindi spero che questo aiuti in qualche modo.

Acclamazioni

11

Si tratta di strumenti diversi per problemi diversi. Solr in realtà non fa raccomandazioni, suggerisce documenti simili basati sui contenuti. Questo non è personalizzato nel senso che non si riferisce all'utente. È molto bravo in questo specifico problema.

Taste/Mahout sono per il filtro collaborativo, che non è specifico per documenti o qualsiasi altro tipo di cosa e differisce in modo cruciale negli "oggetti simili" e le raccomandazioni si basano sulle interazioni utente-elemento, non sulle proprietà dell'articolo.

Entrambe le bilance si adattano bene, a seconda di cosa si ha bisogno e di significato. Non c'è motivo di dubitare di Solr.

Riguardo a Mahout e ai consiglieri, in breve, ha due pezzi. Un pezzo (Taste) è in tempo reale, non basato su Hadoop, e scala per moderare set di dati (forse 10 punti di dati) su una macchina. Mahout aggiunge quindi un'implementazione batch basata su Hadoop e non in tempo reale che può ridimensionarsi. (Ad: io sono l'autore principale di quanto sopra, e sono al lavoro su un sistema next-gen basato su entrambi chiamato Myrrix. Si appellerà se sei interessato a entrambi i consiglieri in stile Mahout scalabili e in tempo reale.)

Se sei interessato a un'azienda che mette insieme una piattaforma basata su quanto sopra, incluso Solr, devi guardare NGDATA.

2

Se sei disposto a sporcarti le mani, puoi utilizzare Solr + Collaborative Filtering per creare un sistema di raccomandazione basato sulla ricerca davvero dolce. Cioè, data una ricerca S e data la cronologia acquisti del ricercatore P_i e dati la cronologia degli acquisti di tutti gli altri P_j dove j≠i. Quindi puoi restituire risultati che soddisfano la ricerca S ma che sono potenziati in base agli elementi che il ricercatore vorrebbe probabilmente basato su altri utenti simili.

Ecco un post sul blog che ho scritto che potrebbe puntare nella giusta direzione: http://opensourceconnections.com/blog/2013/10/05/search-aware-product-recommendation-in-solr/

+0

Ottimo post sul blog letto. –