Sto pensando di creare un sistema di database per le immagini in cui sono archiviati con firme compatte e quindi abbinato a una "immagine di query" che potrebbe essere una versione ridimensionata, ritagliata, ravvivata, ruotata o ruotata di quella memorizzata. Si noti che non sto parlando di algoritmi di somiglianza delle immagini, ma piuttosto del rilevamento di duplicati. Ciò renderebbe le cose molto più semplici. Il sistema non si preoccuperebbe se due immagini hanno un elefante su di esse, sarebbe solo importante rilevare se le due immagini sono di fatto la stessa immagine.Algoritmi di rilevamento di immagini duplicati?
I confronti degli istogrammi semplicemente non funzionano per le immagini di query ritagliate. L'unico modo percorribile per andare a vedere è il rilevamento di forme/bordi. Le immagini dovrebbero essere in qualche modo discretizzate, ad esempio ogni pixel convertito in scala di grigi a 8 livelli. L'immagine discretizzata conterrà vaste regioni dello stesso colore che potrebbero aiutare a indicare le forme. Queste forme potrebbero quindi essere descritte con coefficienti e la loro posizione relativa potrebbe essere ricordata. Da ciò sarebbero state create firme compatte. Questo processo verrà eseguito su ogni immagine che viene memorizzata e su ogni immagine di query quando un confronto deve essere eseguito. Suona come un algoritmo efficiente e realizzabile? Per illustrare questo concetto:
rimosso collegamento ImageShack morti
So che questa è un'area di ricerca immaturo, ho letto Wikipedia sul tema e vi chiedo di proporre le vostre idee su un tale algoritmo.
Lei dice che non sta parlando di algoritmi di similarità, ma duplicare il rilevamento. Tuttavia, se stai anche parlando di consentire cambiamenti, in particolare il ritaglio, devi inevitabilmente formulare un giudizio sul grado di "somiglianza". –
Senza dubbio ci saranno soglie accettabili quando si effettuano i confronti. Il fatto è che anche un'immagine di query ritagliata e ridimensionata contiene ancora un sottoinsieme delle stesse forme/aree di interesse, posizionate relativamente allo stesso modo, ma rappresentate con una diversa quantità di pixel. –