2009-04-03 18 views
9

Sto cercando algoritmi, documenti o software per migliorare i fax, le immagini dalle telecamere dei telefoni cellulari e altre fonti simili per la leggibilità e l'OCR.Algoritmi di elaborazione/miglioramento delle immagini per documenti OCR/leggibilità?

Sono principalmente interessato a miglioramenti semplici (ad esempio, cose che potresti fare usando ImageMagick), ma sono anche interessato a tecniche più sofisticate. Sto già parlando con i venditori, quindi per questa domanda sono principalmente alla ricerca di algoritmi o software open source.

Per chiarire ulteriormente: non sto cercando software OCR o algoritmi; Sto cercando algoritmi per ripulire l'immagine in modo che appaia più leggibile all'occhio umano e possa essere utilizzata per l'OCR.

risposta

5

Ho avuto un problema simile quando stavo scrivendo alcuni software per fare la scansione del libro; fluttuare su internet è un programma chiamato pagetools che esegue il raddrizzamento delle pagine scansionate usando un trucco matematico abbastanza intelligente chiamato Trasformazione Radon.

Ho anche scritto una piccola routine per rendere bianco lo spazio vuoto della pagina; Gli algoritmi OCR tendono a fare molto meglio quando non devono fare i conti con il rumore di fondo. Quello che ho fatto è stato cercare pixel chiari che fossero più di un piccolo raggio di distanza da quelli di colore scuro, e quindi aumentare quelli fino ad essere bianchi puri.

Sono passati alcuni anni, quindi non ho a portata di mano i dettagli esatti dell'implementazione.

4

Un semplice filtro di immagine da esaminare è il "Filtro mediano", un filtro molto semplice, facile da implementare, che aiuta a ripulire il testo scansionato/fotografato. http://en.wikipedia.org/wiki/Median_filter

Problemi correlati