2012-10-18 15 views
13

Sto cercando di capire gow per indicizzare quanto segue in ES.Come indicizzare e memorizzare più lingue in ElasticSearch

Ho molti documenti che sono crawler dal sito web con lingua diverse. Ogni documento ha una categoria, come l'aeroporto, ristorante, fiume, spiaggia ecc, ed è il linguaggio come arabo, inglese .. come

doc {lingua:. "Ita", il contenuto: "qualcosa qui" , categoria: "spiaggia"}

doc {lingua: "vn", il contenuto: "Xin chao", categoria: "spiaggia"}

voglio indicizzare i documenti e di ricerca con ogni lingue;

scelgo opzioni di inglese, e la ricerca con query "qui" => resutls

Dovrei:

  1. Configurare ciascuna nucleo elastico (per macchina per lingua) per ogni lingua. Basta copiare ES per eseguire :)

    Ad esempio: creare elasticsearch_ENGLISH, elastichsearch_VIETNAMESE

  2. creato ogni lingua con ogni indice di elasticsearch Ad esempio: creare indexs

/inglese/tipo/

/vietnames/type/ . Quando cerco una query, cerco solo l'indice della lingua

O lo faccio in un altro modo di cui non sono a conoscenza :)?

risposta

8

Non sono sicuro di aver compreso appieno la vostra preoccupazione.

Se è necessario eseguire la ricerca sul cluster completo (si intende la ricerca in tutte le lingue), non è possibile creare una configurazione per lingua.

Detto questo, hai molte opzioni:

Non è una risposta completa, ma alcuni indizi per aiutare a ...

+0

Grazie dadoonet, :) c'è un indice per ogni lingua è il migliore per questa situazione – phuongdo

+0

ottimi consigli, grazie. Ho appena aggiornato i collegamenti nella tua risposta in quanto sembra che le pagine siano state spostate. – Tom

+1

c'è un buon post su questo qui http: //gibrown.wordpress.com/2013/05/01/tre principi-per-multilingal-indicizzazione-in-elasticsearch / – hellvinz

Problemi correlati