Penso che questo sia molto difficile da automatizzare. Il problema è solo perché hai bisogno di un buon software OCR. E anche se tu avessi questo, e se leggesse qualcosa di sbagliato, a causa della fregatura calligrafia di qualcuno? Se l'ID è sbagliato, il pagamento è prenotato per il dipendente sbagliato e se l'importo è sbagliato ha ottenuto lo stipendio sbagliato!
Entrambe sono cose che non succederà davvero. Solo per mostrarti quanto è difficile trovare un buon ocr, basta dare un'occhiata a come funziona lo captcha. Il principio non è altro che un'immagine di un testo difficile da leggere.
Quindi la mia opinione sarebbe, che non si può davvero automatizzare questo processo. Almeno si può scrivere un programma per aiutare un essere umano inserendo manualmente i valori (anche dare un'occhiata a Amazon Mechanical Turk):
- Mostra sulla destra l'immagine con i valori scritti a mano, o se sono sempre sulla stessa posizione o appositamente contrassegnato (con una scatola intorno a loro, ecc.), cercare di trovare automaticamente questi posti e mostrarli all'utente.
- Sulla sinistra sono disponibili due caselle di testo, in cui l'utente può immettere i valori.
per ottenere questo ad un processo veloce e scorrevole, si deve fare molta attenzione a come l'utente può inserire facilmente i valori da solo utilizzando la tastiera:
- Quando mostrando una nuova foto, impostare la messa a fuoco per l'id testo
- Se l'utente id è sempre una lunghezza specifica, passare alla casella successiva se vengono inseriti tutti i numeri
- (Se si consente questo, un backspace nella prossima scatola vuota dovrebbe concentrarsi di nuovo alla precedente)
- permettono Altrimenti una modifica alla successiva casella di testo per scheda o ritorno colpire
- Normalmente queste caselle di testo sono disposte una sopra l'altra (non affiancati), quindi si deve sostenere il passaggio tra di loro usando l'up down tasti freccia.
- Dopo aver terminato la voce nell'ultima casella di testo mostra automaticamente l'immagine successiva.
- Anche in questo caso di una nuova voce fresca (niente di già inserito) consentire un interruttore semplice per tornare alla vecchia voce utilizzando il backspace o il tasto freccia sinistra)
Utilizzando un tale elaborare una singola persona può inserire molte voci nel database e i costi sono molto più economici rispetto a trovare voci errate nel database in seguito.
Solo un ultimo suggerimento:
Causa questo è un processo noioso per un essere umano che può facilmente porta a errori, forse lasciare che due persone entrano questi valori e solo se entrambi stanno entrando lo stesso che prendere questo valore come approvato. Questo dovrebbe portare a un tasso corretto da qualche parte sopra il 99%. Se devi assolutamente pensare al 100% di consentire a 4-5 persone di verificare una voce e solo se tutte le stesse inseriscono gli stessi valori, prendila come approvata. Per ottenere anche un compendio su quanto sarebbe buono il tuo software ocr, lascia che passi sopra le tue immagini e confronta questi risultati con i valori inseriti per ottenere un'idea, quando puoi davvero contare solo sul tuo ocr.
+1 sottolineando che OCR è non così affidabile. Vorrei un altro +1 per l'idea del turk meccanico;) – zerm