Ho la seguente immagine che mi piacerebbe per preparare un OCR con Tesseract: Pulizia un'immagine per l'OCR con ImageMagick e 'textcleaner'
L'obiettivo è quello di ripulire l'immagine e rimuovere tutti del rumore Sto usando lo script textcleaner
che utilizza ImageMagick con i seguenti parametri:
./textcleaner -g -e normalize -f 30 -o 12 -s 2 original.jpg output.jpg
L'uscita non è ancora così pulito:
Ho provato tutti i tipi di variazioni per i parametri ma con senza fortuna. Qualcuno ha un'idea?
Grazie mille, solo convertendo il jpg in png fatto una grande differenza per me, grazie mille, so che il mio script tesseract è di gran lunga migliore! –