Sto implementando l'istogramma delle caratteristiche del gradiente orientato da "Istogrammi di gradienti orientati per il rilevamento umano" e mi piacerebbe visualizzare il risultato. Tutti i documenti su queste funzionalità utilizzano una visualizzazione standard, ma non riesco a trovare alcuna descrizione di come questi vengono generati. Sarei grato per una spiegazione o un link utile.In che modo le funzioni di HoG sono rappresentate graficamente?
risposta
Le visualizzazioni che vedi documenti possono essere interpretati come segue:
Il descrittore è costituito da cellule M * N coprono la finestra immagine in una griglia. Ogni cella è rappresentata da un istogramma di orientamenti del bordo, in cui il numero di orientamenti del bordo discretizzati è un parametro (in genere 9). L'istogramma della cella è visualizzato da una "stella" che mostra la forza degli orientamenti del bordo nell'istogramma: più forte è un orientamento specifico, più è lungo rispetto agli altri.
Si noti che esistono diversi schemi di normalizzazione: schemi locali, in cui la cella è normalizzata rispetto solo alle celle adiacenti (come nel documento originale di Dalal-Triggs), o schemi globali, in cui la lunghezza dell'orientamento è normalizzata da tutte le cellule. Si noti inoltre che alcuni autori utilizzano più normalizzazioni locali per cella (ad esempio quella a cui mi riferisco in seguito), ma la visualizzazione mostra solo una (o una media di esse).
Il codice Matlab per il lavoro fondamentale di Felzenszwalb et al. visualizza le celle dipingendole sopra un'immagine, in cui la forza viene visualizzata dall'intensità del bordo anziché dalla lunghezza. Puoi trovarlo nel pacchetto che danno qui (DPM). Cercare una funzione denominata HOGpicture.m
L'esempio seguente mostra un modello di una bicicletta (da Felzenszwalb et al.) Con HoG composta da 7 * 11 celle, ciascuno con 8 orientamenti
Un blog chiamato Jurgenwiki ha un codice di esempio (chiamato get_hogdescriptor_visu()
) per la visualizzazione dei descrittori HOG in OpenCV. In passato, ho copiato/incollato il codice Jurgenwiki in un file C++, ho passato le mie caratteristiche HOG in get_hogdescriptor_visu()
e la visualizzazione sembrava abbastanza buona. Ecco un esempio:
Un avvertimento del codice Jurgenwiki è che esso prevede di utilizzare i parametri di default HOGDescriptor()
(ad esempio blocchi 16x16, cellule 8x8, 9 bidoni orientamento). Tuttavia, se stai utilizzando parametri personalizzati nel tuo HOGDescriptor
, puoi modificare il codice Jurgenwiki in modo che corrisponda ai tuoi parametri HOG.
This StackOverflow post è anche molto utile.
C'è un recente lavoro (HOGles) pubblicato nel iccv 2013 sul visualizzazione caratteristiche HOG che può essere molto utile, il codice è disponibile qui http://web.mit.edu/vondrick/ihog/#code
scikit-immagine offre anche la visualizzazione HOG: http://scikit-image.org/docs/dev/auto_examples/plot_hog.html
Qui voglio porre una domanda su due fotogrammi di sequenza di una persona che cammina e abbiamo estratto HOG di ogni immagine e poi prendere la differenza di entrambi gli HOG. Voglio sapere quali informazioni otteniamo nella visualizzazione HOG (Differenza) finale.
Grazie
- 1. Numero ideale di funzioni HoG
- 2. In che modo le funzioni dell'operatore sul posto di Python sono diverse dalle funzioni standard dell'operatore?
- 3. In che modo le funzioni del prototipo sono diverse dalle normali funzioni in javascript?
- 4. Limita le colonne rappresentate in ActiveRecord
- 5. Come vengono rappresentate le unità di misura?
- 6. In che lingua sono scritte le funzioni PHP integrate?
- 7. Che cosa sono le funzioni di Elixir Bang?
- 8. Le funzioni JavaScript sono asincrone?
- 9. Come vengono rappresentate le frazioni nei computer?
- 10. SIFT denso VS HOG
- 11. Come posso visualizzare graficamente le schede macvim?
- 12. Le funzioni in coda JavaScript sono ottimizzate?
- 13. Le funzioni di sistema() C sono ok?
- 14. Stile Scala: fino a che punto sono nidificate le funzioni?
- 15. In che modo le risorse sono ascoltanti in java?
- 16. Perché JSON.stringify non visualizza le proprietà dell'oggetto che sono funzioni?
- 17. Ridimensiona graficamente R ggplotly
- 18. Haar Cascade vs Hog Detection
- 19. Quali sono le buone euristiche per le funzioni di inlining?
- 20. "Le funzioni sono di prima classe" in swift?
- 21. Le funzioni sono definite indipendentemente dall'ordine?
- 22. accesso graficamente dietro proxy
- 23. Unity5 Le funzioni AssetBundle sono obsolete?
- 24. Le coordinate dei punti costruttivi possono essere rappresentate esattamente?
- 25. Le funzioni NPP non sono completamente ottimizzate?
- 26. In che modo l'ambito influenza generalmente l'uso di funzioni annidate?
- 27. Le funzioni analitiche Oracle sono costose?
- 28. Descrittore HOG per rilevamento oggetti
- 29. come sapere quali classi sono rappresentate in ordine di ritorno da predict_proba in scikit-learn
- 30. HOG per "oggetto di rilevamento" opencv
puoi pubblicare una schermata?Ho visto alcuni mostrare l'orientamento del gradiente della dimensione proporzionale al conteggio, ma non sono sicuro che stiamo parlando della stessa cosa. – carlosdc
Questo sito Web potrebbe aiutarti: http://www.geocities.ws/talh_davidc/ – SomethingSomething