Non riesco a trovare una documentazione dettagliata e non mi sembra di sfogliare il codice sorgente. Non voglio rifare il canny edge detection ad esempio se è già stato fatto dal motore Tesseract.Quali operazioni di pre-elaborazione vengono eseguite da Tesseract OCR?
5
A
risposta
6
Questo documento fornisce una panoramica del motore: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
così sembra che non è necessario implementare Algoritmo di Canny.
Tesseract usa Otsu di soglia binarizzare l'immagine prima di elaborarlo https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h
Edit: Se si desidera visualizzare l'immagine binarizzata basta creare un nuovo file di configurazione in "\ tessdata \ configs \", aggiungere questa riga: tessedit_write_images True
ed elaborare la tua immagine: tesseract your_image out your_config_file
. Tesseract salva l'immagine binarizzata come tessinput.tif
.
Problemi correlati
- 1. Tesseract OCR pattern utente
- 2. iOS Tesseract Immagine OCR Preperation
- 3. Tesseract 3 (OCR) - NET Wrapper
- 4. Quale motore OCR è migliore: Tesseract o OCRopus?
- 5. Installazione di Tesseract-OCR su CentOS 6
- 6. UnicodeDecodeError con Tesseract OCR in Python
- 7. Come trovare parametri supportati nel file di configurazione Tesseract OCR
- 8. tesseract-ocr funziona su EC2, non lambda
- 9. riconoscimento caratteri cinesi con Tesseract OCR
- 10. Tesseract 3.0 OCR. NET 4.0 Wrapper
- 11. Android Tesseract OCR 7 cifre del segmento
- 12. OCR (tesseract), rotazione intelligente per Image
- 13. Creazione di un'immagine di allenamento per Tesseract OCR
- 14. Operazioni matematiche durante la preelaborazione del compilatore
- 15. Posso testare tesseract ocr nella riga di comando di Windows?
- 16. Problema di gemma Tesseract-ocr su mac os x
- 17. Preelaborazione delle immagini con OpenCV prima di eseguire il riconoscimento dei caratteri (tesseract)
- 18. Tesseract di Android OCR: utilizzo di dati da oggetti Pixa per visualizzare caselle di delimitazione
- 19. Can `tesseract-ocr` può mettere il risultato in STDOUT?
- 20. Come si installa Tesseract-OCR 3.03 nelle distribuzioni Ubuntu/Linux?
- 21. Miglioramento dei risultati OCR Tesseract con testo sfocato
- 22. Impostare esplicitamente il carattere da utilizzare per il riconoscimento da Tesseract-OCR
- 23. OCR: Immagine in testo?
- 24. Quali sono le liste di attività eseguite da ConnectedAndroidTest?
- 25. configure: biblioteca leptonica mancante (per la costruzione di Tesseract-ocr-3.01 da MinGW)
- 26. Perché le funzioni sull'oggetto vengono eseguite da una funzione autoesposta?
- 27. Errore Python durante l'importazione di image_to_string da tesseract
- 28. Perché queste attività vengono eseguite in sequenza?
- 29. Utilizzo di Tesseract da java
- 30. Come vengono eseguite le funzioni concatenate in JQuery?
Dove salva il file tessinput.tif? – kiwicomb123
@neoneye @ cortex42 Nella mia directory '\ tessdata \ configs \', ho un sacco di file, come 'api_config', quindi quando dici di creare un nuovo file di configurazione, intendi semplicemente duplicare una configurazione esistente? Come posso aprire questi file per aggiungere la linea che hai suggerito? Dove potrò quindi vedere il file '.tif'? – Joshua