Qual è il modo migliore per gestire i sinonimi (frasi) utilizzando Lucene? In particolare, quando ho bisogno di eseguire query come: a OR b O c dSinonimi utilizzando Lucene
Come aggiungere un nuovo campo chiamato "sinonimi" a ciascun documento durante l'indicizzazione? Il valore di questo campo dovrebbe avere un elenco di tutti i sinonimi. Sarebbe aggiunto a un documento solo quando quel documento ha uno dei sinonimi.
Eseguirò quindi una query di ricerca "OR" che cercherebbe la parola chiave di ricerca in questo campo insieme ad altri campi.
Questo approccio può funzionare bene per qualsiasi tipo di query?
FYI, I sinonimi nella mia applicazione sono totalmente personalizzati e non dal dizionario inglese ... cioè. "Global Leader in Finance" potrebbe anche significare "Top Investment Bank" o "Fortune 500 Finance company" ecc. Ecc.
Si prega di suggerire.
Grazie.
Grazie per i tuoi ingressi Adam ... Potresti per favore fare riferimento alla mia domanda di nuovo? Ora l'ho modificato. –
Il modulo WordNet crea un indice Lucene, proprio come te. Questo indice che costruisce viene infine utilizzato per espandere le query. Se hai semplicemente provato a creare questo indice dal dizionario di WordNet, sono sicuro che potresti facilmente sapere quali nomi di campo sta usando per il suo indice e aggiungere tu stesso le tue voci personalizzate. –