Così ho scritto i miei codici per HoG e la sua variante per lavorare con immagini di profondità. Tuttavia, sono bloccato a testare il mio SVM addestrato nella parte della finestra di rilevamento.Come implementare un algoritmo della finestra scorrevole migliore?
Tutto quello che ho fatto adesso è quello di creare prima le piramidi dell'immagine dall'immagine originale, ed eseguire una finestra scorrevole di dimensioni 64x128 dall'angolo in alto a sinistra in basso a destra.
Ecco una cattura video di esso: http://youtu.be/3cNFOd7Aigc
Ora il problema è che sto diventando più falsi positivi di quanto mi aspettassi.
C'è un modo per rimuovere tutti questi falsi positivi (oltre all'allenamento con più immagini)? Finora posso ottenere il 'punteggio' da SVM, che è la distanza dal margine stesso. Come posso usarlo per sfruttare i miei risultati?
Qualcuno ha qualche idea sull'implementazione di un buon algoritmo per finestre scorrevoli?
Ottima risposta, ma ho poche altre domande se tu o qualcun altro non ti dispiace. Come lo uso insieme allo spazio della bilancia? Tratto la finestra rilevata in un'altra scala come solo un altro vicino? E come entra in gioco la soppressione non massimale? Comunque, ancora, grazie mille per la tua risposta chiara. –
Buona domanda sulle bilance! Potresti in effetti includere la scala nel quartiere (sinistra/destra/su/giù/più piccolo/più grande), ma dipende molto dai tuoi dati e dall'obiettivo finale: ottieni molti falsi positivi su più scale? Sfortunatamente il trial-and-error è la migliore metodologia pratica nella visione artificiale. Riguardo alla soppressione non massimale, beh, quello che ho descritto è una forma di soppressione non massimale (si mantengono solo i massimi locali). – Antoine