2009-08-13 10 views
7

sto usando letter_regcog esempio dalla OpenCV, è utilizzato insieme di dati da UCI che hanno struttura come questa:immagine dati FOM come "Lettera Immagine Riconoscimento Dataset" Come creare da UCI

 
Attribute Information: 
    1. lettr capital letter (26 values from A to Z) 
    2. x-box horizontal position of box (integer) 
    3. y-box vertical position of box (integer) 
    4. width width of box   (integer) 
    5. high height of box   (integer) 
    6. onpix total # on pixels  (integer) 
    7. x-bar mean x of on pixels in box (integer) 
    8. y-bar mean y of on pixels in box (integer) 
    9. x2bar mean x variance   (integer) 
    10. y2bar mean y variance   (integer) 
    11. xybar mean x y correlation  (integer) 
    12. x2ybr mean of x * x * y  (integer) 
    13. xy2br mean of x * y * y  (integer) 
    14. x-ege mean edge count left to right (integer) 
    15. xegvy correlation of x-ege with y (integer) 
    16. y-ege mean edge count bottom to top (integer) 
    17. yegvx correlation of y-ege with x (integer) 

esempio:

 
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8 
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10 

ora ho segmentato l'immagine della lettera e voglio trasformarlo in dati come questo per metterlo a riconoscerlo ma non capisco la media di tutti i valori come "6. onpix total # on pixels" cosa significa? Puoi spiegare la media di questi valori. Grazie.

risposta

5

Non ho familiarità con l'esempio letter_recog di OpenCV, ma questo sembra essere un vettore di funzionalità, o un insieme di statistiche sull'immagine di una lettera che viene utilizzata per classificare le occorrenze future della lettera. I risultati della tua segmentazione dovrebbero lasciarti con una maschera binaria con 1 sulla lettera e 0 ovunque. onpix è semplicemente il numero totale di pixel che cadono sulla lettera o, in altre parole, la somma della tua maschera binaria.

La maggior parte dei valori rimanenti nell'elenco deve essere calcolata in base all'insieme di pixel con valore 1 nella maschera binaria. x e y sono solo la posizione del pixel. Ad esempio, x-bar è solo la media campionaria di tutte le posizioni x di tutti i pixel che hanno un 1 nella maschera. Dovresti essere in grado di trovare facilmente riferimenti sul web per le definizioni matematiche di media, varianza, covarianza e correlazione.

14-17 sono leggermente diversi poiché sono basati sui pixel del bordo, ma i calcoli dovrebbero essere simili, appena sopra un diverso set di pixel.

3

Mi chiamo Antonio Bernal. Nella pagina 3 di questo articolo troverete una buona descrizione per ogni valore. Letter Recognition Using Holland-Style Adaptive Classifiers. Se hai qualche dubbio fammi sapere. Sto cercando di far funzionare questo algoritmo, ma il mio problema è che non so come ridimensionare i valori per adattarli all'intervallo 0-15. Avete qualche idea su come fare questo?

+0

Ciao Anotnio, non ho letto la carta ma i valori di ridimensionamento dovrebbero essere moltiplicati per un fattore di scala. Ad esempio, se ho onpix = da 0 a 255, allora posso ridimensionarlo prendendo: scaled_onpix = (onpix * 15)/255 È questo ciò che stavi cercando? –

+0

Sto anche lottando con quale sia il modo migliore per ridimensionarlo. Immagino che gli autori debbano assumere un limite superiore alla dimensione dell'immagine. Sembra che la maggior parte delle lettere occupino solo una frazione del riquadro di delimitazione, ad esempio # 6: onpix avrebbe un valore massimo molto più grande di quello che un personaggio reale potrebbe mai ottenere. – emschorsch

Problemi correlati