Ho implementato uno strumento OCR Android utilizzando solo tesseract per le cifre dell'ocra. Finora, sta dando un'accuratezza piuttosto elevata con i normali caratteri digitali. Tuttavia, la precisione è terribile quando si tratta di cifre a 7 segmenti (quelle trovate sugli LCD).Android Tesseract OCR 7 cifre del segmento
Ho provato a ritagliare la mia immagine, la whitelist con 0 a 9 e anche qualche elaborazione delle immagini senza successo. Qualche idea là fuori su come aumentare la precisione? O forse alcuni consigli sull'addestramento delle specifiche cifre a 7 segmenti per tesseract mi aiuteranno sicuramente molto.
Grazie in anticipo.
Non penso che si possano ottenere buoni risultati senza riqualificazione. Sarebbe bello se ci fosse un file Traineddata pubblicamente disponibile per cifre a 7 segmenti, ma non sono riuscito a trovarne uno quando ho guardato. – rmtheis
Grazie per la risposta. Il tuo blog mi ha davvero aiutato molto nella mia implementazione. Quindi, molte grazie a te. Sto pianificando di addestrarlo e sto cercando in bbtesseract per il processo di boxe. Apprezzerò molto se qualcuno può condividere alcuni suggerimenti per il processo di formazione, perché quello ufficiale è un po 'di confusione per me. – laurie7
È possibile utilizzare [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) per modificare o generare file TIFF/box da utilizzare durante la formazione. C'è anche uno script di PowerShell 'train.ps1' che aiuta ad automatizzare il resto della formazione. – nguyenq