2009-06-30 12 views
27

Qualcuno sa se esiste?Lucene Hebrew analyzer

Sono stato googling questo per monthes ...

Grazie

+0

È giunto il momento che la comunità open source ne faccia uno. Mi sembra che il vero sorgere sia molto difficile, al punto da richiedere ingenti quantità di manodopera, ma che sia possibile una qualche base di discontinuità, e forse un minimo ostacolo è meglio di zero derivare. Probabilmente inizierò a lavorarci da solo. Se qualcuno è interessato, per favore contattami. –

+0

... E come primo passo, cercherò di usare l'enumerazione di hspell (3). È effettivamente uno stemmer pronto! –

risposta

21

Aggiornamento
HebMorph

Per curiosità innescata da tua domanda, ho contattato Itamar Syn-Hershko che era attivo sulle mailing list di Lucene circa un anno fa, quando stava lavorando ad un analizzatore ebraico per Lucene. Gli ho chiesto se ha completato il suo analizzatore. Ecco alcuni bit rilevanti dalla sua risposta:

Per farla breve, no I no. Non esiste un analizzatore gratuito ebraico open source per Lucene, che posso dire con certezza. Sono non so quale sia il tuo sfondo su soggetto, ma credimi quando dico non c'è un modo semplice per farlo; it potrebbe essere anche il Lucene non è costruito per le ricerche in ebraico, ma sono d'accordo che una soluzione deve essere data. Certo, il modo più sicuro per indicizzare e cercare i testi in ebraico in ebraico è e usare uno stemmer specializzato, e l'integrazione con Lucene non è la più facile anche dopo aver fatto questo. Ci sono alcune ottime soluzioni per la ricerca ebraica nel mercato, solo quella che so di usare Lucene nel è il nucleo; Recentemente ho provato contatto con loro, non ancora risposta ...

Il prodotto commerciale basato su Lucene menzionato si chiama ATTIVIO e the ATTIVIO website ha la pretesa di avere il supporto ebraico. A SIGTRS (Hebrew Text Retrieval interest group), ci sono stati alcuni discussion regarding ATTIVIO che afferma che è basato su Lucene.

Quindi, a quanto pare, è possibile creare un analizzatore ebraico decente per Lucene, ma non è disponibile alcun analizzatore libero in questo momento.

+0

Wow, grazie mille! – Roey

+0

Nessun problema; felice che fosse d'aiuto. ;) – Naaff

+4

Ciao, ho finalmente avuto il tempo di iniziare a lavorarci su uno, e finora sembra promettente. Vedi: http://www.code972.com/blog/hebmorph/. Itamar. – synhershko

0

dtsearch ha un plugin di ebraico chiamato "pensim". Sembra sviluppato da "wizcomtech.com".