2013-01-02 39 views
6

Voglio iniziare un grande progetto ed è necessario confrontare due file audio per ottenere% della corrispondenza.confronta due file audio. sound match

Esempio:

  1. audio A è l'audio originale.

  2. audo B viene registrato dal microfono. (tutto è uguale all'audio A, eccetto per la voce)

  3. Voglio sapere quanto vicino B è a A in percentuale. (100% = identico)

Qualcuno sa come fare?

forse potrebbe essere possibile confrontando spettro di file A con lo spettro di file di B ..

+1

Tutto dipende da cosa intendi per "confronto di due file audio". Il 100% è facile da immaginare, ma per quanto riguarda lo 0% ?. Come puoi vedere, la definizione di "confronto dei file audio" non è ben definita, quindi anche la tua soluzione non sarà definita. Il confronto dovrebbe essere calcolato su un punto di vista della percezione (suoni che assomigliano allo stesso su entrambi i file audio) o dovrebbe essere basato su una semplice differenza aritmetica byte-byte? –

+0

Potresti scrivere un libro sull'elaborazione e il confronto del suono, quindi votato come "troppo ampio". –

+0

Che cosa significa il confronto per te? Devi controllare la voce e lo strumentale. Questo può aiutare? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy

risposta

2

Ho fatto questo genere di cose nel mio progetto corso undergrad ma con i file di immagine. La cosa che dovresti esaminare è Cross-correlation. In cui è possibile misurare le somiglianze tra due segnali. Inoltre, è possibile pre-processare i file audio, ad esempio: normalizzare, applicare un filtro passa-basso per rimuovere il rumore.

Vorrei suggerire Elaborazione del segnale digitale di Oppenheim per ottenere una profonda comprensione dell'elaborazione del segnale.

Ma ancora una volta queste tecniche sono piuttosto vaghe, fino a quando non si sa che tipo di somiglianze si desidera trovare.

+0

Per seguire il confronto delle immagini, c'è una società (LTU) che ha un'applicazione per confrontare le immagini basate su un vettore e quindi i vettori sono confrontati, questo riflette la differenza tra 2 immagini. Questo non è un confronto byte/byte, corrisponde a immagini ritagliate e invertite. Forse la loro tecnica può essere adattata ai file audio. Detto questo, dubito che tu possa mettere le mani sul loro algo. –

+0

@ Nick.T Ma penso che ci debbano essere dei progetti open source per fare queste cose. –

+0

Lo so solo perché un cliente mi ha detto "Voglio LTU". Quindi nessuna ricerca di progetti opensource per me. Sono d'accordo che questo tipo di algo deve esistere in un progetto opensource. Forse la domanda potrebbe essere riformulata e chiesta nello stack 'mathematica' ... –