Ho provato Tesseract con iPhone e ho valutato la precisione del 70% senza preelaborazione dell'immagine. Ho anche notato che potrebbe essere scarso nell'estrarre cifre. Ho sentito parlare del motore OCRopus OCR: quale è meglio, Tesseract o OCRopus, in termini di estrazione di cifre e se la mia preelaborazione dell'immagine è bassa?
Qualcuno ha eseguito test utilizzando entrambi i motori confrontando i risultati usando le solite metriche?Quale motore OCR è migliore: Tesseract o OCRopus?
risposta
Inizialmente OCRopus utilizzava effettivamente Tesseract come motore di riconoscimento all'interno, ma in seguito lo hanno cambiato con il proprio motore nuovo di zecca. È ancora fresco e non maturo. Abbiamo fatto un confronto di accuratezza circa un anno fa e OCRopus stava decisamente perdendo con Tesseract, non sto nemmeno parlando di obiettivi commerciali. Da allora ho smesso di seguire i progressi di OCRopus, ma quello che so perfettamente che l'attività sul forum di supporto OCRopus è ormai prossima allo zero. Ciò significa che nessuno lo sta usando. Per lo più le persone usano motori commerciali, ma se il prezzo è un problema per loro e possono tollerare una minore precisione, usano Tesseract. È sicuramente il migliore tra gli Open Source.
Ciao pomodoro, se vogliamo usare motori commerciali, cosa consiglieresti? –
ABBYY è leader nel mercato OCR. A seconda delle esigenze e del budget, è possibile scegliere tra ABBYY FineReader Engine (http://abbyy.com/ocr_sdk), ABBYY Cloud OCR SDK (http://ocrsdk.com), ABBYY Mobile OCR Engine (http: // www. abbyy.com/mobileocr/) e ABBYY FlexiCapture Engine (http://www.abbyy.com/flexicapture_engine). Lavoro per ABBYY e posso darti ulteriori informazioni, se necessario. –
è anche possibile controllare l'attività dei progetti in collegamento "cambiamenti"
https://code.google.com/p/ocropus/source/list?repo=ocropy
https://code.google.com/p/tesseract-ocr/source/list
Tesseract è molto più affollate
- 1. iOS Tesseract Immagine OCR Preperation
- 2. Tesseract OCR pattern utente
- 3. Tesseract 3 (OCR) - NET Wrapper
- 4. OCR (tesseract), rotazione intelligente per Image
- 5. Android Tesseract OCR 7 cifre del segmento
- 6. Installazione di Tesseract-OCR su CentOS 6
- 7. tesseract-ocr funziona su EC2, non lambda
- 8. UnicodeDecodeError con Tesseract OCR in Python
- 9. Tesseract 3.0 OCR. NET 4.0 Wrapper
- 10. riconoscimento caratteri cinesi con Tesseract OCR
- 11. Quali operazioni di pre-elaborazione vengono eseguite da Tesseract OCR?
- 12. Miglioramento dei risultati OCR Tesseract con testo sfocato
- 13. Posso testare tesseract ocr nella riga di comando di Windows?
- 14. Come si installa Tesseract-OCR 3.03 nelle distribuzioni Ubuntu/Linux?
- 15. Business o OCR Library per iPhone SDK
- 16. La migliore API .NET OCR?
- 17. Creazione di un'immagine di allenamento per Tesseract OCR
- 18. OCR: Immagine in testo?
- 19. Can `tesseract-ocr` può mettere il risultato in STDOUT?
- 20. Problema di gemma Tesseract-ocr su mac os x
- 21. Come trovare parametri supportati nel file di configurazione Tesseract OCR
- 22. Quale è il migliore oggetto o database OLEDB o Excel
- 23. Quale motore 3D per rubino
- 24. jqGrid o dataTable, quale migliore?
- 25. OCR open source per il cinese
- 26. Errore Tesseract. min illegale o specifiche max
- 27. Dizionario personalizzato per Tesseract
- 28. Quale è migliore, gcc o armcc per le ottimizzazioni NEON?
- 29. Quale IDE Android è migliore: Android Studio o Eclipse?
- 30. Quale nome canonico è migliore? www o non www?
Non capisco il motivo per cui la questione è chiusa. I motori OCR possono essere confrontati tra loro per precisione: è un confronto molto oggettivo. Non molto "basato sull'opzione". –