2015-04-10 8 views
5

Spiacente, questa deve essere probabilmente una domanda stupida. ma sono abbastanza nuovo per l'apprendimento automatico e l'OCR di Tessaract. Ho sentito che l'OCR di Tessaract può essere addestrato.Tessaract OCR utilizza le reti neurali come meccanismo di allenamento predefinito

Quello che devo sapere è che Tessaract OCR utilizza le reti neurali come meccanismo di allenamento predefinito o dobbiamo programmarlo esplicitamente per utilizzare le reti neurali ?.

Scusa se sto pensando in modo sbagliato a questo concetto di "allenamento". ma quello che ho bisogno di sapere esattamente è che Tessaract sta già usando NN o, in caso contrario, come posso avvicinarmi usando NN con tessaract OCR per migliorare l'accuratezza del riconoscimento?

Se uno può per favore suggerirmi alcune buone risorse/modo di riferirsi/provare e per iniziare sarebbe un grande aiuto anche.

quello che attualmente so sul concetto di formazione di base per l'apprendimento automatico della macchina e per eseguire operazioni OCR di immagine di base in Tessaract OCR.

risposta

6

Sembra che Tessaract utilizzi un Classificatore adattivo per impostazione predefinita. Check this out per una buona lettura:

https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

Sembra che ci sia un'opzione chiamata "modalità Cube" dove sarà passare ad usare NNs per il sistema di apprendimento, invece del classificatore adattativo (https://code.google.com/p/tesseract-ocr-extradocs/wiki/Cube). Maggiori informazioni sulle categorie di classificazione adattativi:

http://www.cs.indiana.edu/~rawlins/website/adaptivity/information-helper.html

Inoltre, legati molto da vicino è un Classificatore Learning System:

http://en.wikipedia.org/wiki/Learning_classifier_system

Inoltre, la vostra terminologia di "formazione" è molto vicino. La formazione è come insegnate al sistema di riconoscimento del modello o al sistema di apprendimento quali risposte dovrebbe dare a determinati insiemi di input. Quindi, utilizza somiglianze quando incontra dati sconosciuti per classificare i nuovi dati. A mio avviso, l'apprendimento automatico è uno dei campi più interessanti (probabilmente opinioni distorte ma qualunque cosa!) Continua l'apprendimento! Tu sei il meta-allievo: imparare come insegnare a una macchina per imparare! Roba forte!

+0

Thx bro. chiaro e praticamente esattamente quello che volevo. – HarshaXsoad

Problemi correlati