Ci sono molte librerie disponibili per l'estrazione di testo da immagini.
Tesseract e Abby sono i migliori del OCR SDK ho usato. Il vantaggio principale con Abby SDK è che i suoi risultati sono piacevoli rispetto a Tesseract. E l'unico svantaggio è che è acquistabile. Mentre il vantaggio principale in Tesseract è che è open source e puoi migliorarne il risultato usando qualsiasi libreria di elaborazione immagini.
1) Abby-https://github.com/abbyysdk/ocrsdk.com si arrivi l'immagine al suo server, converte l'immagine in testo e download il risultato
2) Tesseract-https://github.com/nolanbrown/Tesseract-iPhone-Demo/tree/master/OCRDemo Si converte l'immagine in testo utilizzando tessrect sdk. Risultato non preciso come Abby ma non richiede la connessione a Internet.
3) Tesseract + OpenCV - https://github.com/pablosproject/iPhone-OCR-Tesseract-and-OpenCV Probabilmente il miglior sdk che ho trovato finora a leggere l'immagine senza connessione internet. Il vantaggio di questo codice è che integra anche OpenCV, quindi è possibile aggiungere algoritmi come l'algoritmo di estrazione del blog e la trasformazione di Hough per aumentare l'accuratezza del risultato.
Spero che aiuti.
fonte
2013-04-11 13:31:40
Ho usato Tesseract + OpenCV, che mi ha aiutato molto. Non è molto ottimale ma riconosce il testo dalle immagini. –