2015-06-11 15 views

risposta

10

Prima di tutto, devo dichiarare che sono il Product Manager di Lucidworks Fusion.

Sembra che tu sappia già che Fusion funziona con Solr (o uno o più cluster Solr o istanze), utilizzando Solr per l'archiviazione e l'interrogazione dei dati. Lo scopo di Fusion è quello di rendere più semplice l'utilizzo di Solr, l'integrazione di Solr e la creazione di soluzioni complesse che fanno uso di Solr. Alcune delle cose che Fusion offre che molte persone trovano utile per questo includono:

  • Connettori e un quadro di connettori. Bare Solr offre una buona API e la possibilità di inviare determinati tipi di file sulla riga di comando. Fusion viene fornito con diversi connettori di origine dati pre-costruiti che recuperano i dati da vari tipi di sistemi, li elaborano in base alle esigenze (compresa l'analisi, la trasformazione e la mappatura dei campi) e inviano i risultati a Solr. Questi connettori includono negozi di documenti comuni (cloud e on-premise), database relazionali, archivi dati NoSQL, HDFS, applicazioni aziendali e un web crawler molto potente e configurabile.
  • Integrazione sicurezza. Solr non ha alcuna autenticazione o autorizzazione (sebbene questa versione della settimana 5.2 abbia un'API innestabile e un'implementazione di base di Kerberos per l'autenticazione). Fusion avvolge le API Solr con una versione protetta. Fusion ha integrazioni pulite in LDAP, Active Directory e Kerberos per l'autenticazione. Ha anche un modello di autorizzazione a grana fine per gestire e configurare Fusion e Solr. Inoltre, il modello di autorizzazioni Fusion può collegare automaticamente le appartenenze ai gruppi da LDAP/AD con gli elenchi di controllo di accesso dalle origini dati dei connettori Fusion in modo da ottenere il controllo degli accessi a livello di documento con mirroring dai sistemi di origine quando si eseguono query di ricerca.
  • Modello di elaborazione delle tubazioni. Fusion fornisce un modello di pipeline con fasi modulari (in formato API e GUI) per semplificare la definizione e la modifica delle trasformazioni di dati e documenti. È analogo a unix shell pipes. Ad esempio, durante l'indicizzazione puoi includere fasi per definire mappature di campi, calcolare nuovi campi, aggregare documenti, inserire dati da altre fonti, ecc. Prima di scrivere su Solr. Quando si esegue una query, è possibile fare lo stesso, oltre a trasformare la query, eseguire e restituire i risultati di altre analisi e applicare filtri di sicurezza.
  • GUI di amministrazione. Fusion ha un'interfaccia utente Web per la visualizzazione e la configurazione di quanto sopra (oltre alla configurazione di base Solr). Pensiamo che questo sia conveniente per le persone che vogliono usare Solr, ma non usarlo regolarmente abbastanza per ricordare come usare le API, i file di configurazione e gli strumenti da riga di comando.
  • Funzioni sofisticate basate sulla ricerca: utilizzando il modello di pipeline descritto in precedenza, Fusion include (e rende facile da usare) alcuni componenti più ricchi di ricerca, tra cui: elaborazione del linguaggio naturale e moduli di estrazione delle entità; Regolazione della pertinenza basata sui segnali in tempo reale. Intendiamo fornire più di questi in futuro.
  • Elaborazione di dati analitici: Fusion include e integra Apache Spark per l'esecuzione di analisi approfondite su dati archiviati in Solr (o in corso verso Solr). Sebbene Solr includa implicitamente alcune funzionalità di analisi dei dati, questo non è il suo scopo principale. Usiamo Apache Spark per guidare l'estrazione dei segnali di Fusion e la messa a punto della pertinenza, e ci aspettiamo di esporre le API in modo che gli utenti possano facilmente eseguire altre elaborazioni lì.
  • Altro: molte utili funzioni varie come: dashboarding UI; interfaccia utente di ricerca di base con ottimizzazione della pertinenza manuale; monitoraggio più facile; gestione e programmazione del lavoro; avvisi in tempo reale con integrazione della posta elettronica e altro ancora.

Naturalmente molti di questi possono essere creati o scritti contro Solr, senza Fusion, ma pensiamo che fornire tali tipi di integrazione aziendale sia prezioso per molte persone.

+0

Poiché sei il product manager della fusione di lucidi, posso chiederti quando sarà la fusione a implementare il solr 5? E, quando ciò accadrà, fornirai uno strumento di migrazione? Grazie per la tua risposta e buona vita. – donthurtme

+0

Le versioni correnti di Fusion supportano già Solr 5.x, anche se non vengono fornite con incluso. È possibile scaricare un'installazione Solr 5.x separatamente e puntare Fusion su di essa. Si prevede che la prossima versione di Fusion includa Solr 5.x. – gkanapathy

+0

@gkanapathy è possibile PUSH SolrInputDocument in Fusion? – Garytxo