Ho studiato tecniche di ricerca di suono, metafono e altre stringhe negli ultimi giorni, e nella mia comprensione entrambi gli algoritmi funzionano bene nella gestione di parole non inglesi tradotte in inglese.Abilitazione soundex/metaphone per caratteri non inglesi
Tuttavia, il requisito che vorrei sarebbe che tale ricerca funzionasse nelle lingue originali, non trasferite, alfabeti accomodanti come tedesco, norvegese e persino alfabeti cirillici.
Esistono algoritmi di ricerca in grado di gestire completamente questi alfabeti? O sto meglio usando librerie di ricerca full-text di terze parti come Lucene? Di conseguenza, la domanda diventa: "Lucene gestisce alfabeti non inglesi?"
Se il tuo caso d'uso è solo ricerca testuale in lingue diverse dall'inglese, potresti non aver bisogno di soundex. Hai bisogno di Lucene con un Analizzatore appropriato, come hanno detto ire_and_curses. Se vuoi gestire diverse varianti di scrittura della stessa parola, avrai bisogno di un algoritmo di corrispondenza fonetica. Puoi dire di più sul tuo caso d'uso? –