Sto cercando una libreria/classe che consenta il confronto intelligente di due stringhe. Al massimo darebbe come risultato la percentuale di come due stringhe sono simili. Sto confrontando i nomi delle società, gli indirizzi che sono registrati in diversi repository, avendo così molti errori di ortografia o incongruenze nei nomi.Confronto stringa intelligente
stringhe di esempio per confrontare:
"Good Company Ltd." vs. "GoodCompany"
"Baker Street 2" vs. "Baker Str. 2"
Se ho un risultato in percentuale del alikeness, che questo può essere un input per fusione intelligente di tali dati.
Conosci qualche buona libreria che consenta il confronto tra stringhe così intelligenti?
Prova a dare un'occhiata a questo: http://stackoverflow.com/questions/2344320/comparing-strings-with-tolerance – Justin
Puoi dirci quale percentuale ti aspetteresti di restituire per ciascuno di questi due confronti tra stringhe ? – jszigeti
'' GreatOrgansiation ''ha qualche" similarità "a' "GoodCompany" '? Stai cercando di confrontare il significato? Quanto sono simili "" accetta "e" eccetto "che sembrano simili ma hanno significati diversi? Che ne dite di "country fair" e "equal and fair" o ", four candles" e "fork handle" '? C'è un elemento di PNL o è un algoritmo più semplice? Vuoi "Significa uguale", "Sembra uguale" o "Sembra uguale"? – Jodrell