Come convertire un'immagine in segmenti di caratteri?

Spesso nel processo di OCR, un file immagine viene essenzialmente tagliato in segmenti e ogni carattere viene riconosciuto come un segmento ciascuno. Per esempio, Unsegmented text as image Come convertire un'immagine in segmenti di caratteri?

deve essere trasformato in qualcosa di simile Image in which text has been segmented and is ready for OCR

Inoltre, c'è qualche algoritmo per le lingue asiatiche come Telugu prontamente disponibili per questo scopo? Se no, come si fa per l'inglese?

fonte

2012-06-09 tuxnani

Può essere facilmente fatto utilizzando OpenCV. Di seguito è riportato un codice di esempio:

import cv2 
import numpy as np 

# Load the image 
img = cv2.imread('sof.png') 

# convert to grayscale 
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) 

# smooth the image to avoid noises 
gray = cv2.medianBlur(gray,5) 

# Apply adaptive threshold 
thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2) 
thresh_color = cv2.cvtColor(thresh,cv2.COLOR_GRAY2BGR) 

# apply some dilation and erosion to join the gaps 
thresh = cv2.dilate(thresh,None,iterations = 3) 
thresh = cv2.erode(thresh,None,iterations = 2) 

# Find the contours 
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE) 

# For each contour, find the bounding rectangle and draw it 
for cnt in contours: 
    x,y,w,h = cv2.boundingRect(cnt) 
    cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2) 
    cv2.rectangle(thresh_color,(x,y),(x+w,y+h),(0,255,0),2) 

# Finally show the image 
cv2.imshow('img',img) 
cv2.imshow('res',thresh_color) 
cv2.waitKey(0) 
cv2.destroyAllWindows()

uscita sarà simile di seguito:

enter image description here

fonte

2012-06-10 16:51:46

+1 grande risposta, ma penso che potrebbe utilizzare alcuni commenti ad ogni passo (soprattutto perché OP non ha menzionato OpenCV nella sua domanda) – Amro

@Amro: commenti aggiunti –

Come convertire un'immagine in segmenti di caratteri?

risposta

Problemi correlati