2010-04-05 8 views

risposta

1

Non sono sicuro di quello che stai chiedendo. Se stai chiedendo come utilizzare FFT per il riconoscimento dell'immagine, ecco alcuni pensieri.

FFT può essere utilizzato per eseguire la "classificazione" dell'immagine. Non può essere utilizzato per riconoscere volti o oggetti diversi, ma può essere utilizzato per classificare il tipo di immagine. FFT calcola il contenuto di frequenza spaziale dell'immagine. Ad esempio, la scena naturale, il viso, la scena della città, ecc. Avranno diversi FFT. Pertanto è possibile classificare l'immagine o anche all'interno dell'immagine (ad esempio foto aerea per classificare il terreno).

Inoltre, FFT viene utilizzato in pre-elaborazione per il riconoscimento dell'immagine. Può essere utilizzato per OCR (riconoscimento ottico dei caratteri) per ruotare l'immagine scansionata nell'orientamento corretto. FFT del testo digitato ha un forte orientamento. Stessa cosa per il controllo delle parti nell'automazione industriale.

+0

Ma non ha spiegato il motivo per cui ** ** può essere usato per fare cosa simile – user198729

+0

I stava rispondendo ** come ** si potrebbe usare FFT. Quanto al ** perché **, dipenderebbe dal problema. La FFT è dispendiosa dal punto di vista computazionale, quindi il motivo principale per cui lo si usa è se la componente di frequenza è una caratteristica utile. – sjchoi

0

Non penso che troverete molti metodi in uso che si basano su Fourier Transforms per il riconoscimento delle immagini.

In caso di rumore di sale e pepe, può essere considerato rumore ad alta frequenza e pertanto è possibile filtrare a bassa passata la FFT prima di effettuare un confronto con l'immagine di destinazione. Immagino che funzionerebbe, ma che immagini diverse che sono in qualche modo simili (come entrambe le fotografie scattate all'esterno) si registrerebbero come la stessa immagine.

+1

In realtà, ci sono molte, molte implementazioni di FFT per l'abbinamento di immagini nei sistemi militari e industriali. È IL classico algoritmo per la corrispondenza delle immagini. In questi giorni ci sono approcci molto più sofisticati, ma invariabilmente sono gli ordini di grandezza più complessi. – Greg

+0

Posso vedere FFT utilizzato come una piccola parte nel riconoscimento di immagini. Ma sarei molto curioso di qualsiasi sistema che abbia FFT come il suo modo principale di risolvere il problema. Di solito il contenuto di frequenza delle fotografie è molto simile, indipendentemente dalla somiglianza delle due immagini. Se avete esempi di queste implementazioni sarei felice di guardarlo e rivedere la mia vista se necessario. –

+0

@kigurai - FFT è il nucleo della correlazione incrociata utilizzata per l'abbinamento di immagini/modelli –

7

Aggiornamento per rispondere effettivamente alla domanda che hai chiesto ... :) Pre-elaborare l'immagine con un filtro non lineare per sopprimere il rumore di sale & pepe. Filtro mediano forse?

lezione di base su FFT su filtri adattati segue ...

Il modo classico di rilevare un'immagine più piccola all'interno di un'immagine più grande è il filtro abbinato. Essenzialmente, questo implica una correlazione incrociata dell'immagine più grande con l'immagine più piccola (la cosa che stai cercando di riconoscere).

  1. Per ogni posizione nell'immagine grande
  2. Overlay l'immagine più piccola sull'immagine grande
  3. Moltiplicare tutti i pixel corrispondenti
  4. Somma i risultati
  5. mettere che somma in questa posizione nell'immagine filtrata

Il filtro corrispondente è ottimale dove l'unico rumore nell'immagine più grande è il rumore bianco.

Questo IS è computazionalmente lento, ma può essere scomposto in operazioni FFT (trasformata veloce di Fourier), che sono molto più efficienti. Esistono approcci molto più sofisticati alla corrispondenza delle immagini che tollerano altri tipi di rumore molto meglio di quanto fa il filtro corrispondente. Ma pochi sono efficienti quanto il filtro corrispondente implementato usando FFT.

Google "filtro corrispondente", "correlazione incrociata" e "filtro di convoluzione" per ulteriori informazioni.

Per esempio, ecco uno breve spiegazione che sottolinea anche gli svantaggi di questo approccio oldschool Image Matching: http://www.dspguide.com/ch24/6.htm

Problemi correlati