2011-09-24 24 views
14

Sono un principiante in computer vision, ma so come usare alcune funzioni su opencv. Sto cercando di usare Opencv per Document Recognition, voglio un aiuto per trovare i passaggi per esso.Come utilizzare Opencv per il riconoscimento del documento con l'OCR?

Sto pensando di usare l'esempio opencv find_obj.cpp, ma i documenti, ad esempio il passaporto, hanno alcune variabili, nome, data di nascita, immagini. Quindi, ho bisogno di un aiuto per definire i passaggi per esso, e se è possibile come funzione devo usare sui passaggi.

Non sto chiedendo un codice complesso, ma se qualcuno ha qualche legame esempio o si può semplicemente digitare una procedura dettagliata, è di grande aiuto.

risposta

24

Ci sono due passaggi molto diversi qui coinvolti. Uno sta rilevando il tuo oggetto e l'altro lo sta analizzando.

Per il rilevamento di oggetti, si sta solo cercando di capire se l'oggetto è nel telaio, e approssimativamente dove si trova. Il framework di funzioni OpenCv è ottimo per questo. Per alcune esercitazioni e un codice di esempio completo, consulta le esercitazioni di OpenCv features2d e in particolare lo feature matching tutorial.

Per l'analisi, è necessario scavare in riconoscimento ottico dei caratteri (OCR). OpenCv non include le librerie OCR, ma consiglio di controllare tesseract-ocr, che è una grande libreria OCR. Se i tuoi documenti hanno una struttura strutturata (coerente dei campi di testo), allora tesseract-ocr è tutto ciò di cui hai bisogno. Per analisi più avanzate, verificare ocropus, che utilizza tesseract-ocr ma aggiunge l'analisi del layout.

+0

provo questa soluzione, ma se devo io leggere documenti successo su esempio del mondo reale, penso che con la matematica modello devo utilizzare solo un'immagine con stessa risoluzione. O no? – Ricardo

+1

Se hai problemi con un esempio del mondo reale, potresti dover addestrare tesseract-ocr per il font specifico che stai utilizzando. Altrimenti utilizzerà il suo database predefinito e potrebbe non corrispondere al testo con cui stai lavorando. Potresti provare a ridimensionare il testo prima di inviarlo a tesseract-ocr, ho trovato un'altezza intorno a 20 px che funziona bene. –

+0

Hai un link su come allenare il tesseract? Sto avendo problemi a ottenere buoni risultati e non riesco a trovare un buon tutorial su come fare il training – Tjorriemorrie

Problemi correlati