sto usando letter_regcog esempio dalla OpenCV, è utilizzato insieme di dati da UCI che hanno struttura come questa:immagine dati FOM come "Lettera Immagine Riconoscimento Dataset" Come creare da UCI
Attribute Information: 1. lettr capital letter (26 values from A to Z) 2. x-box horizontal position of box (integer) 3. y-box vertical position of box (integer) 4. width width of box (integer) 5. high height of box (integer) 6. onpix total # on pixels (integer) 7. x-bar mean x of on pixels in box (integer) 8. y-bar mean y of on pixels in box (integer) 9. x2bar mean x variance (integer) 10. y2bar mean y variance (integer) 11. xybar mean x y correlation (integer) 12. x2ybr mean of x * x * y (integer) 13. xy2br mean of x * y * y (integer) 14. x-ege mean edge count left to right (integer) 15. xegvy correlation of x-ege with y (integer) 16. y-ege mean edge count bottom to top (integer) 17. yegvx correlation of y-ege with x (integer)
esempio:
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8 I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10
ora ho segmentato l'immagine della lettera e voglio trasformarlo in dati come questo per metterlo a riconoscerlo ma non capisco la media di tutti i valori come "6. onpix total # on pixels" cosa significa? Puoi spiegare la media di questi valori. Grazie.
Ciao Anotnio, non ho letto la carta ma i valori di ridimensionamento dovrebbero essere moltiplicati per un fattore di scala. Ad esempio, se ho onpix = da 0 a 255, allora posso ridimensionarlo prendendo: scaled_onpix = (onpix * 15)/255 È questo ciò che stavi cercando? –
Sto anche lottando con quale sia il modo migliore per ridimensionarlo. Immagino che gli autori debbano assumere un limite superiore alla dimensione dell'immagine. Sembra che la maggior parte delle lettere occupino solo una frazione del riquadro di delimitazione, ad esempio # 6: onpix avrebbe un valore massimo molto più grande di quello che un personaggio reale potrebbe mai ottenere. – emschorsch