Sto provando a creare cascate di haar per eseguire l'OCR di un font specifico; un classificatore per personaggio.Generazione di buoni dati di addestramento per cascate di haar
Posso generare tonnellate di dati di addestramento semplicemente disegnando il carattere sulle immagini. Quindi, il piano è di generare dati di allenamento positivi per ciascun personaggio e utilizzare gli esempi di altri personaggi come dati di allenamento negativi.
Mi chiedo quante variazioni dovrei inserire nei dati di addestramento. Normalmente proverei semplicemente tutto, ma ho capito che queste cose impiegano giorni per allenarsi (per ogni personaggio!) Quindi qualche consiglio sarebbe buono.
Così, alcune domande:
- Ha l'algoritmo di formazione riconoscere che non mi importa di pixel trasparenti? O funzionerà meglio se sovrappongo i personaggi su sfondi diversi?
- Devo includere immagini in cui ogni carattere è mostrato con prefissi e suffissi diversi, o dovrei semplicemente trattare ciascun carattere individualmente?
- Devo includere immagini in cui il carattere è scalato verso l'alto o il basso? Ho capito che l'algoritmo praticamente ignora le dimensioni e ridimensiona tutto per efficienza comunque?
Grazie!