Vorrei rilevare i numeri di base in inglese da 0 a 9 utilizzando il semplice OCR su Android. Ho cercato OCR per Android, ma è troppo complesso per il mio scopo principale, c'è un modo più semplice per rilevare solo i numeri su Android?Qual è il modo migliore per eseguire il riconoscimento dei numeri di base?
risposta
Un'alternativa semplice consiste nel predefinire le cifre come bitmap e trovarle utilizzando la correlazione incrociata normalizzata.
Ci sono un sacco di svantaggi in questo metodo:
- No robustezza a diversi tipi di carattere
- No robustezza alla scala dei numeri
- ...
Ma forse questo è ciò che bisogno solo di iniziare.
Se si desidera eseguire l'OCR dalla telecamera basata sul telefono, sarà difficile utilizzare immagini bitmap predefinite: le foto verranno scattate con scala diversa, conterranno rumore, verranno messe in risalto ecc. difficilmente essere abbastanza precisi.
Se stai sviluppando un'app Android, probabilmente utilizzerai Java. La cattiva notizia è che non ci sono SDK Java OCR open source nativi. Esistono API Java che racchiudono le chiamate per interfacce native, ad esempio per uno dei più popolari motori OCR opensource - Tesseract (http://groups.google.com/group/tesseractocrocr/) - ci sono alcuni wrapper Java come tesjeract (http://code.google.com/p/tesjeract/) o Tess4J (http://tess4j.sf.net/). Potrebbe funzionare per te, ma è piuttosto difficile da configurare e richiederà lo sviluppo di preelaborazione delle immagini e formazione dei font dalla tua parte.
Un'altra soluzione potrebbe essere un servizio cloud. Richiede l'applicazione per l'utente finale per avere la connessione Internet, ma è indipendente dalla scelta del linguaggio di programmazione e dalle limitazioni delle risorse. Date un'occhiata allo ABBYY Cloud OCR SDK, è un SDK OCR basato su cloud lanciato di recente da ABBYY. È in versione beta, quindi per ora è totalmente gratuito e ha un Android code samples pronto all'uso. Dispone di pre-elaborazione delle immagini incorporata, non richiede formazione e funziona in modo semplice, basta inviare, visualizzare e ricevere dati acquisiti. Inoltre, ha una funzionalità di riconoscimento a livello di campo che potrebbe farti risparmiare un prezioso pezzo di risorse di elaborazione di dispositivi di piccole dimensioni. Lavoro @ ABBYY e, se necessario, posso fornirti ulteriori informazioni sui nostri prodotti.
- 1. Qual è il modo migliore per eseguire codice Java sandboxed?
- 2. Qual è il modo migliore per eseguire un'espressione matematica?
- 3. Qual è il modo migliore per eseguire un'inizializzazione costosa?
- 4. Qual è il modo migliore per eseguire jQuery .change()
- 5. Qual è il modo migliore per eseguire il backup dei dati su Google App Engine?
- 6. Il modo migliore riconoscimento somiglianza lista lunghezze
- 7. Qual è il modo migliore per eseguire il debug di css su ie?
- 8. Qual è il modo migliore per documentare il codice f #?
- 9. Qual è il modo migliore per rilevare il colore bianco?
- 10. Qual è il modo migliore per riutilizzare il parser Lua?
- 11. Qual è il modo migliore per eseguire l'upgrade di un'app per rails per supportare SSL SSL?
- 12. Qual è il modo migliore per impostare l'URL di base per una richiesta Ajax utilizzando Jquery?
- 13. Qual è il modo migliore per rilevare l'eccezione nell'attività?
- 14. Qual è il modo migliore/più sicuro per reinstallare Homebrew?
- 15. Qual è il modo migliore per testare javascript?
- 16. Qual è il modo migliore per imparare Django 1.5?
- 17. Qual è il modo migliore per affermare l'uguaglianza di numpy.array?
- 18. Qual è il modo migliore per tracciare l'esecuzione di JavaScript?
- 19. Qual è il modo migliore per eseguire il bulk degli inserimenti del database da C#?
- 20. Qual è il modo migliore per gestire più azioni?
- 21. Qual è il modo migliore per organizzare più sottoview?
- 22. Qual è il modo migliore per dividere due oggetti TimeSpan?
- 23. qual è il modo migliore per implementare hashCode()?
- 24. Qual è il modo migliore per guardare un'applicazione desktop?
- 25. Qual è il modo migliore per eseguire il ciclo di interi con al massimo k bit ON?
- 26. Qual è il modo migliore per testare un'app per rails?
- 27. Qual è il modo migliore per attuare questo GetHashCode composito()
- 28. Qual è il modo migliore per estendere le funzionalità?
- 29. qual è il modo migliore per ottenere l'URL di base da un controller
- 30. Qual è il modo migliore per rappresentare arbitrariamente grandi numeri in c?
È necessario eseguire il riconoscimento OCR da una fotocamera basata su telefono? – Nikolay
@Nikolay Sì, ne ho bisogno. –