2014-11-19 13 views

risposta

6

Questo documento fornisce una panoramica del motore: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

così sembra che non è necessario implementare Algoritmo di Canny.

Tesseract usa Otsu di soglia binarizzare l'immagine prima di elaborarlo https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h

Edit: Se si desidera visualizzare l'immagine binarizzata basta creare un nuovo file di configurazione in "\ tessdata \ configs \", aggiungere questa riga: tessedit_write_images True ed elaborare la tua immagine: tesseract your_image out your_config_file. Tesseract salva l'immagine binarizzata come tessinput.tif.

+0

Dove salva il file tessinput.tif? – kiwicomb123

+0

@neoneye @ cortex42 Nella mia directory '\ tessdata \ configs \', ho un sacco di file, come 'api_config', quindi quando dici di creare un nuovo file di configurazione, intendi semplicemente duplicare una configurazione esistente? Come posso aprire questi file per aggiungere la linea che hai suggerito? Dove potrò quindi vedere il file '.tif'? – Joshua

Problemi correlati