2010-02-11 10 views
5

Qualcuno conosce una libreria per confrontare gli indirizzi in Java?Indirizzi di confronto Java

Qualcosa che darebbe uguaglianza sugli indirizzi, scritti in modi diversi.

Ad esempio, si deve riconoscere che

"22 Acacia Avenue" and "22 acacia av." 

è lo stesso indirizzo.

Naturalmente, questo può aggravare molto, ecco perché lo sto chiedendo.

Grazie in anticipo.

+2

Stai chiedendo come analizzare gli indirizzi in testo libero in forma canonica. Dopo averli analizzati, equipararli è facile. – Yoni

+0

@Yoni, sto dando un'occhiata alla distanza di Levenshtein per testare ogni parte. Grazie. – Tom

risposta

0

L'unico modo per confrontare veramente e con precisione gli indirizzi è quello di garantire che entrambi sono standardizzati e certificati. Negli Stati Uniti, è possibile utilizzare il codice a barre del punto di consegna a 12 cifre su un indirizzo certificato che può fungere da identificatore univoco per un determinato indirizzo. Oltre a ciò, non c'è molto altro che puoi perché gli indirizzi non sono auto-validanti e possono essere scritti in innumerevoli modi diversi. Anche la regex complessa non aiuta. E non farmi iniziare su come le città e le città incorrano in modo errato.

Devo dire che sono il fondatore di SmartyStreets. Abbiamo uno CASS-certified address verification service che ti consente di pulire, standardizzare, verificare e confermare ogni indirizzo, il che rende la rilevazione duplicata un pezzo di torta. Offriamo entrambe le elaborazioni batch per ottenere un C ASS-certified list o un controllo "live" individuale tramite address verification web service API.