Utilizzo un analizzatore di palle di neve per bloccare i titoli di più documenti. Tutto funziona bene, ma le loro sono alcune stranezze.Utilizzo di una combinazione di caratteri jolly e staminali
Esempio:
Una ricerca per "valvo", "valvola", o "valvole" restituisce lo stesso numero di risultati. Questo ha senso poiché l'analizzatore di palle di neve riduce tutto a "valv".
Mi imbatto in problemi quando si utilizza un carattere jolly. Una ricerca per "valvola *" o "valvole *" non restituisce alcun risultato. La ricerca di "valv *" funziona come previsto.
Capisco perché questo sta accadendo, ma non so come risolverlo.
Ho pensato di scrivere un analizzatore che memorizza i token staminali e non. Applicando fondamentalmente due analizzatori e combinando i due flussi di token. Ma non sono sicuro che questa sia una soluzione pratica.
Ho anche pensato di utilizzare AnalyzingQueryParser, ma non so come applicarlo a una query su più campi. Inoltre, l'utilizzo di AnalyzingQueryParser restituirebbe risultati per "valvola" durante la ricerca di "valvole *" e questo non è il comportamento previsto.
Esiste un modo "preferito" di utilizzare sia i caratteri jolly che gli algoritmi di derivazione?
+1 per la seconda soluzione, è il modo più naturale per farlo. –