Sto cercando il metodo più rapido ed efficiente per rilevare un oggetto in un video in movimento. Cose da notare su questo video: è molto granuloso e a bassa risoluzione, anche lo sfondo e il primo piano si muovono contemporaneamente.Qual è il metodo migliore per il rilevamento di oggetti in video in movimento a bassa risoluzione?
Nota: Sto provando a rilevare un carrello su una strada in un video in movimento.
metodi che ho provato:
La formazione di un Haar Cascade - ho tentato la formazione dei classificatori per identificare l'oggetto prendendo copping più immagini dell'oggetto desiderato. Ciò ha dimostrato di produrre sia molti falsi rilevamenti che nessun rilevamento (l'oggetto desiderato non è mai stato rilevato). Ho usato circa 100 immagini positive e 4000 negativi.
Keypoint SIFT e SURF - Quando si tenta di utilizzare uno di questi metodi basati su funzionalità, ho scoperto che l'oggetto che volevo rilevare era a risoluzione troppo bassa, quindi non c'erano abbastanza funzioni da abbinare per rendere accurato rilevamento. (Oggetto desiderato non è mai stato rilevato)
Corrispondenza modello: questo è probabilmente il metodo migliore che ho provato. È il più preciso anche se il più hacky di tutti. Riesco a rilevare l'oggetto per un video specifico utilizzando un modello ritagliato dal video. Tuttavia, non esiste una precisione garantita poiché tutto ciò che è noto è la migliore corrispondenza per ogni fotogramma, non viene eseguita alcuna analisi sul modello di percentuale corrispondente al fotogramma. Fondamentalmente, funziona solo se l'oggetto è sempre nel video, altrimenti creerà un falso riconoscimento.
Quindi questi sono i 3 grandi metodi che ho provato e tutti hanno fallito. Ciò che funzionerebbe meglio è qualcosa come la corrispondenza dei modelli, ma con invarianza di scala e rotazione (che mi ha portato a provare SIFT/SURF), ma non ho idea di come modificare la funzione di corrispondenza dei modelli.
Qualcuno ha qualche suggerimento su come eseguire al meglio questa attività?
Come è il camion orientato? La sua forma/orientamento cambia? La fotocamera cambia posizione? È un video one-off o un sistema che deve funzionare in molte condizioni diverse? – endolith
Sono d'accordo con l'endolite, è fondamentale definire il problema con maggiori dettagli. La scelta del metodo influenzerà la robustezza. – Ivan
La vista del camion al suo fianco e si muove orizzontalmente. La forma del veicolo non cambia molto, motivo per cui l'abbinamento dei modelli funziona, ma voglio ancora che il mio metodo sia robusto. Fondamentalmente la telecamera esegue una panoramica a sinistra e a destra, seguendo alcuni veicoli diversi, con altri veicoli che passano in background. In sostanza, voglio che funzioni in più situazioni rispetto a una (ma principalmente con video di qualità simile). Il minimo che voglio realizzare è un rivelatore di oggetti in movimento all'interno di un video in movimento. – monky822