2010-10-27 13 views
8

Ho un set di dati che contiene molti indirizzi (voci di 60.000-ish). Voglio classificare questi indirizzi in indirizzi residenziali o commerciali.Come verificare se un indirizzo è un indirizzo commerciale o residenziale

Qualcuno conosce una buona API/servizio per iniziare a farlo?

  • Non credo che il geocoder di google maps possa farlo in questo momento.

  • Fedex e UPS entrambi sembrano avere API, ma che vengono rilasciati solo alle società che sono trasporto dei prodotti (una sorta di necessità di conoscerli solo)

USPS API: https://www.usps.com/nationalpremieraccounts/rdi.htm

Fedex API: http://www.fedex.com/us/developer/web-services/index.html

Questo è un progetto di hobby, così gratuito o economico è meglio! Ma le soluzioni a pagamento non sono fuori questione.

+1

Basta essere consapevoli del fatto che gli unici dati ufficiali reali di queste cose viene dal USPS stesso, che concede in licenza i dati per il confronto le spese di spedizione solo ... quindi ricordatevi di controllare i termini prima di tuffarsi in. – Matt

risposta

0

Date un'occhiata alle API a http://compass.webservius.com

Si tratta di una lista di 16+ milioni di imprese negli Stati Uniti (si propone di essere un elenco completo di business). Se un indirizzo non è presente, è probabile che si tratti di un indirizzo di residenza.

+0

Questo sembra davvero buono, dovrò dargli un giro. se ha funzionato! –

+0

Alla fine sono riuscito a codificarlo. Questa soluzione non è stata sufficiente per me. L'API è un po 'severa in quanto richiede corrispondenze esatte o corrispondenze prefissate esatte per i parametri di ricerca, quindi non è stato trovato un numero elevato di indirizzi non residenziali nei risultati dell'API che ha distorto i miei risultati. Ho anche provato un approccio al bounding box usando lat, lng (che ho anche per il mio set di dati), ma i risultati sembravano essere carenti. Forse me ne vado nel modo sbagliato, o forse ho bisogno di normalizzare i miei indirizzi in qualche modo. –

0

Questo è un po 'un trucco, ma perché non scrivere uno script per verificare se la prima riga dell'indirizzo contiene uno dei cognomi dell'elenco dei censimenti? Questo dovrebbe portarti la maggior parte degli indirizzi residenziali. Supponendo che il nome della persona/azienda faccia parte dell'indirizzo che hai.

+0

che è un po 'di Ho paura che questo potrebbe produrre molti falsi positivi.Un esempio di John Smith @ blah blah drive colpirebbe le ubicazioni degli Smith & Wesson Store –

+0

Questo è un buon punto, potresti affinare un po 'per evitare i caratteri che non sono t nei nomi e cercare il nome o Mr/Mrs/etc e un cognome, ma è ancora lontano dall'essere perfetto – Swordgleam

6

Come accennato in precedenza, RDI è la strada da percorrere. RDI è l'acronimo di "indicatore di consegna residenziale" e indica se un indirizzo è residenziale o commerciale. L'unico problema è che devi essere uno sviluppatore per usarlo e devi avere indirizzi standardizzati e certificati, per non parlare della quota annuale di licenza da USPS per centinaia di dollari. Una volta ottenuto e programmato una soluzione, puoi semplicemente assegnargli un indirizzo con qualsiasi vecchio ZIP e aspettarti che funzioni. L'indirizzo deve avere il codice a barre completo del punto di consegna a 12 cifre.

Oppure è possibile utilizzare un fornitore di servizi per fare la stessa cosa e pagare circa $ 50-100 per un elenco delle dimensioni.

Full disclosure: Sono il fondatore di SmartyStreets. Abbiamo RDI incluso nella nostra offerta senza alcun costo aggiuntivo. Ciò significa che è semplice come trascinare l'elenco sul nostro sito Web e averlo elaborato e tornare in pochi secondi. Offriamo inoltre un'API del servizio web address verification che restituirà l'indicatore residenziale/commerciale per farti conoscere il tipo di indirizzo con cui stai lavorando.

2

Whitepages affermazioni che ti permettono di farlo nella loro API. Per scopi di hobby fino a 200 query al giorno, è gratuito. Dovresti interrogare il tipo di zonizzazione.

La struttura dati ID indirizzo contiene un campo "Utilizzo", che è descritto come "Solo valido per LocationType indirizzo USA. Indica l'opinione del servizio postale statunitense in merito al fatto che questo indirizzo sia principalmente" Commerciale "o" Residenziale "."

Problemi correlati