Come utilizzare Opencv per il riconoscimento del documento con l'OCR?

Sono un principiante in computer vision, ma so come usare alcune funzioni su opencv. Sto cercando di usare Opencv per Document Recognition, voglio un aiuto per trovare i passaggi per esso.Come utilizzare Opencv per il riconoscimento del documento con l'OCR?

Sto pensando di usare l'esempio opencv find_obj.cpp, ma i documenti, ad esempio il passaporto, hanno alcune variabili, nome, data di nascita, immagini. Quindi, ho bisogno di un aiuto per definire i passaggi per esso, e se è possibile come funzione devo usare sui passaggi.

Non sto chiedendo un codice complesso, ma se qualcuno ha qualche legame esempio o si può semplicemente digitare una procedura dettagliata, è di grande aiuto.

fonte

2011-09-24 Ricardo

Ci sono due passaggi molto diversi qui coinvolti. Uno sta rilevando il tuo oggetto e l'altro lo sta analizzando.

Per il rilevamento di oggetti, si sta solo cercando di capire se l'oggetto è nel telaio, e approssimativamente dove si trova. Il framework di funzioni OpenCv è ottimo per questo. Per alcune esercitazioni e un codice di esempio completo, consulta le esercitazioni di OpenCv features2d e in particolare lo feature matching tutorial.

Per l'analisi, è necessario scavare in riconoscimento ottico dei caratteri (OCR). OpenCv non include le librerie OCR, ma consiglio di controllare tesseract-ocr, che è una grande libreria OCR. Se i tuoi documenti hanno una struttura strutturata (coerente dei campi di testo), allora tesseract-ocr è tutto ciò di cui hai bisogno. Per analisi più avanzate, verificare ocropus, che utilizza tesseract-ocr ma aggiunge l'analisi del layout.

fonte

2011-09-26 09:31:44

provo questa soluzione, ma se devo io leggere documenti successo su esempio del mondo reale, penso che con la matematica modello devo utilizzare solo un'immagine con stessa risoluzione. O no? – Ricardo

Se hai problemi con un esempio del mondo reale, potresti dover addestrare tesseract-ocr per il font specifico che stai utilizzando. Altrimenti utilizzerà il suo database predefinito e potrebbe non corrispondere al testo con cui stai lavorando. Potresti provare a ridimensionare il testo prima di inviarlo a tesseract-ocr, ho trovato un'altezza intorno a 20 px che funziona bene. –

Hai un link su come allenare il tesseract? Sto avendo problemi a ottenere buoni risultati e non riesco a trovare un buon tutorial su come fare il training – Tjorriemorrie

Come utilizzare Opencv per il riconoscimento del documento con l'OCR?

risposta

Problemi correlati