risposta
Aggiornamento
HebMorph
Per curiosità innescata da tua domanda, ho contattato Itamar Syn-Hershko che era attivo sulle mailing list di Lucene circa un anno fa, quando stava lavorando ad un analizzatore ebraico per Lucene. Gli ho chiesto se ha completato il suo analizzatore. Ecco alcuni bit rilevanti dalla sua risposta:
Per farla breve, no I no. Non esiste un analizzatore gratuito ebraico open source per Lucene, che posso dire con certezza. Sono non so quale sia il tuo sfondo su soggetto, ma credimi quando dico non c'è un modo semplice per farlo; it potrebbe essere anche il Lucene non è costruito per le ricerche in ebraico, ma sono d'accordo che una soluzione deve essere data. Certo, il modo più sicuro per indicizzare e cercare i testi in ebraico in ebraico è e usare uno stemmer specializzato, e l'integrazione con Lucene non è la più facile anche dopo aver fatto questo. Ci sono alcune ottime soluzioni per la ricerca ebraica nel mercato, solo quella che so di usare Lucene nel è il nucleo; Recentemente ho provato contatto con loro, non ancora risposta ...
Il prodotto commerciale basato su Lucene menzionato si chiama ATTIVIO e the ATTIVIO website ha la pretesa di avere il supporto ebraico. A SIGTRS (Hebrew Text Retrieval interest group), ci sono stati alcuni discussion regarding ATTIVIO che afferma che è basato su Lucene.
Quindi, a quanto pare, è possibile creare un analizzatore ebraico decente per Lucene, ma non è disponibile alcun analizzatore libero in questo momento.
Wow, grazie mille! – Roey
Nessun problema; felice che fosse d'aiuto. ;) – Naaff
Ciao, ho finalmente avuto il tempo di iniziare a lavorarci su uno, e finora sembra promettente. Vedi: http://www.code972.com/blog/hebmorph/. Itamar. – synhershko
dtsearch ha un plugin di ebraico chiamato "pensim". Sembra sviluppato da "wizcomtech.com".
- 1. Lucene Standard Analyzer vs Snowball
- 2. Lucene QueryParser doveva funzionare con Custom Analyzer con stopfilter e porterstemfilter
- 3. PMD - Code Analyzer warnings
- 4. Solr query/field analyzer
- 5. Come specificare due campi in Lucene QueryParser?
- 6. Plagio Analyzer (confrontato con Web Content)
- 7. Lucene IndexWriter lento per aggiungere documenti
- 8. Xcode Analyzer - Ignora bersagli CocoaPods
- 9. MySql query analyzer - soluzioni gratuite
- 10. Utilizzo di Apache Lucene per la ricerca
- 11. Lucene - alla ricerca di un campo del valore numerico
- 12. Lucene/python
- 13. Prestazioni Lucene
- 14. Perché Lucene QueryParser ha bisogno di un analizzatore
- 15. SQL Server Transaction Log Explorer/Analyzer
- 16. ElasticSearch Analyzer e Tokenizer per email
- 17. Viewer/Query Analyzer per database SQLite
- 18. statico Code Analyzer per C++ in Linux
- 19. Gestione + come personaggio speciale nella ricerca Lucene
- 20. Lucene queryparser con "/" in Query criteri
- 21. Errore semplice esempio lucene 4.0 con origine (non jar lib)
- 22. NullPointerException su Lucene-Appengine's SegmentIndexInput readByte method
- 23. Come si combinano due query Lucene utilizzando OR?
- 24. comparazione delle prestazioni tra Zend Lucene e Java Lucene
- 25. Lucene come archivio dati
- 26. Come funziona Lucene
- 27. Lucene "o query"
- 28. non interrogare in lucene
- 29. Ricerca multipla in Lucene
- 30. lucene Fields vs. DocValues
È giunto il momento che la comunità open source ne faccia uno. Mi sembra che il vero sorgere sia molto difficile, al punto da richiedere ingenti quantità di manodopera, ma che sia possibile una qualche base di discontinuità, e forse un minimo ostacolo è meglio di zero derivare. Probabilmente inizierò a lavorarci da solo. Se qualcuno è interessato, per favore contattami. –
... E come primo passo, cercherò di usare l'enumerazione di hspell (3). È effettivamente uno stemmer pronto! –