2012-03-12 17 views
10

Ho letto un sacco di articoli sulla algoritmi di localizzazione/rilevazione targa, come quelli menzionati qui:dati pubblici istituito per la targa di localizzazione/rilevazione

What are good algorithms for vehicle license plate detection?

speravo di correre la mia su un set di dati di immagini di auto con numeri di licenza noti in modo da poter misurare l'errore.

Dopo una discreta quantità di spunti, non riesco a trovare nessun set di dati disponibile pubblicamente di questo tipo. Qualcuno ne sa qualcosa? Altrimenti, il mio prossimo passo sarà inviare per e-mail gli autori di carta.

+0

Potrebbe essere sfortunato su questo. Le targhe dei veicoli sono considerate informazioni di identificazione personale ai fini della legge sulla protezione dei dati. Pertanto, qualsiasi database pubblico di tali informazioni sarebbe quasi certamente contrario alla legge. Ci possono essere organizzazioni che vendono tali informazioni, dopo averle filtrate (si spera) per rimuovere le immagini di tutti i veicoli in cui i proprietari non li vogliono inclusi, tuttavia questo sarebbe ancora illegale in molti paesi. –

+0

Perché non hai mandato via email agli autori i set di dati in primo luogo? – monksy

+0

Ero preoccupato per la legalità di un set pubblico. Ho pensato di pubblicare la domanda per vedere se qualcuno avesse trovato una cosa ovvia che mi era sfuggita, e quindi ci sarebbe stata una sorta di record pubblico per gli altri che cercavano lo stesso, dal momento che questa domanda non era stata posta prima. –

risposta

11

io non sono sicuro di come illegale è di aver pubblicato i set di dati di test di immagini di qualsiasi tipo preso in uno spazio pubblico, dal momento che è stato fatto e che sono stati utilizzati in documenti per la Scopo dei risultati del controllo incrociato, ma non so quale livello di autorizzazione è stato necessario per pubblicare il set di dati. Ti fa venire voglia di pensare prima di uscire e fare un po 'di foto e poi pubblicarle. So che Street View di Google offusca tutte le lastre, incasinando completamente quello che dovrebbe essere un numero quasi illimitato di miniere d'oro di dati di analisi delle lastre. È ancora una miniera d'oro della localizzazione delle auto da dati di scene naturali, ma frustrante dal punto di vista del piatto. Questo potrebbe spiegare perché è così difficile trovare buoni set di dati prontamente disponibili. Penseresti che avremmo una collezione abbastanza standard di decine di migliaia di piatti da qualche parte. Una ricerca di immagini di Google per "il retro della macchina" produce in realtà meno risultati di quanto ci si aspetterebbe e si deve fare un po 'di selezione per eliminare le immagini che non funzionano.

Il sito Web Medialab pubblicato da @Abosamra è davvero buono, anche se sono piatti greci, non americani.

Con http://www.vision.caltech.edu/html-files/archive.html le immagini di Cars 1999 (posteriore) 2 sono eccezionali, sebbene ce ne siano solo 126. Questo è di gran lunga il miglior dataset americano che è immediatamente scaricabile che ho trovato, comprese le auto in scene naturali con piastre chiaramente leggibili.

Le immagini del 2001 dello stesso sito presentano molte ripetizioni e sono per lo più a bassa risoluzione per essere utili per testare l'OCR, sebbene possano essere utilizzate per testare la localizzazione delle placche e ce ne sono oltre 500.

Oxford è ri-pubblicando le auto Caltech dal primo collegamento con un molto più grande insieme di dati di 1155 immagini di auto troppo piccole per l'OCR, ma potrebbero essere utili per il processo di rilevamento auto:

http://www.robots.ox.ac.uk/~vgg/data3.html

Il MIT ha un set di dati che a prima vista sembra promettente, ma poi risulta che le lastre sono troppo piccole per fare OCR e sono in formato ppm, quindi potrebbe richiedere un passo in più per convertirle in un formato di file più usato. Potrebbero essere utili per i test di localizzazione.

http://cbcl.mit.edu/projects/cbcl/software-datasets/CarData1Readme.html

UCSD ha una serie di circa 878 immagini, ma richiede ottenere il permesso da Louka Dlagnekov o Serge Belongie per accedere al set di dati. http://vision.ucsd.edu/belongie-grp/research/carRec/car_data.html

Se non ti dispiace usare le piastre al di fuori degli Stati Uniti, puoi trovare più dataset. Eccone uno, ad esempio in Croazia, ma ha 510 immagini, che sono di buona qualità.Sono un po 'zoomate, quindi non sono grandiose per testare la capacità di estrarre l'auto dalla scena naturale, ma molto utile per identificare le lastre.

http://www.zemris.fer.hr/projects/LicensePlates/hrvatski/rezultati.shtml

Dal piastre reali sono così difficili da trovare in scene auto, potrebbe essere possibile fare un set di dati utilizzando piastre falsi. Ecco un sito che può creare piatti falsi:

http://acme.com/licensemaker/

Le piastre falsi potrebbe essere l'ideale per fare un set di dati di test di lastre di loro per la segmentazione, e le fasi di riconoscimento dei caratteri del problema con un sacco di diversa provenienza piastra e caratteri.

Quindi l'unica cosa che rimane è trovare un modo per incorporare delle lastre false create a caso in alcune immagini con lastre sfocate.

Posso aggiornare il mio post se trovo di più.

Problemi correlati