2010-08-26 16 views
7

Esiste un programma che rileva il bitrate di un MP3? Non sto parlando del bitrate effettivo con il quale il file è stato codificato, ma del vero bitrate che può essere calcolato solo mediante l'analisi dello spettro di frequenza.Rilevamento del bitrate MP3 tramite analisi dello spettro di frequenza

Ad esempio, se ho un MP3 codificato in 128 kbps la cui dimensione è 1 MB, e quindi transcodifico questo MP3 a 320 kpbs la cui dimensione diventa 3 MB, avrò la stessa traccia audio identica, ma con dimensioni diverse .

Se ho un MP3 da 320 kbps e lo transcodifico a 128 kbps, perderò un po 'di qualità e quindi alcune dimensioni del file.

Tuttavia, non ho modo di verificare che 320 kbps sia il bitrate "reale" del mio MP3.

dettagli sono spiegati in questo articolo: http://www.fileden.com/files/2009/2/14/55/My%20Documents/MP3%20Bit%20Rate%20Quality%20Detection%20through%20Frequency.pdf

+0

Si perde di qualità in entrambi i casi, mp3 è lossy ogni volta che viene codificato ... – MarcusJ

risposta

0

L'unica cosa che si può facilmente determinare dall'analisi dello spettro di frequenza è ciò che è la frequenza di campionamento del file di input mp3.

Ad esempio, se il tuo mp3 è campionato a 44100, non avrai alcun suono sopra 22050 hz e questo sarà chiaramente visibile sul grafico dello spettro.

Dal momento che si sta attraversando nel dominio trascendentale qui, provate questo:

  • codifica mp3 a 128kbps
  • transcodifica per dire 320kbps
  • prova RAR-zione o 7Z-zione risultante di file e file originale . Osservare i rapporti di compressione.

Loro "entropia" vale a dire. la casualità sarà diversa e forse quel numero ti dirà qualcosa su quante informazioni sono "fabbricate" nell'espansione del bitrate durante la transcodifica.

+0

Se il processo di transcodifica è% Standard 100 compliant quindi nessuna informazione dovrebbe essere "fabbricata". Una cosa che cambierà nella versione a 320 kbps è la modalità stereo. Il valore predefinito per 128 kbps è stereo congiunto mentre quello predefinito per 320 è stereo "vero". Quindi, se provi questo, probabilmente dovresti forzare la stessa modalità stereo per entrambi i bitrate. (Ovviamente anche la frequenza di campionamento dovrebbe essere la stessa, ma dovrebbe essere ovvio.) Anche la versione da 320 kbps dovrebbe essere codificata senza un filtro cut-off, perché è già stata applicata. –

2

La frequenza di taglio e il bit rate sono indipendenti. Sì, la maggior parte delle persone usa i preset, quindi c'è una correlazione tra i due, ma non è deterministica.

0

È possibile aprire il file "Adobe Audition" o "Cool Edit" e aprire la finestra di analisi della frequenza. Se le linee di frequenza raggiungono i 20 kHz o più il bitrate in mp3, forse 320 kbps se le linee di frequenza si riducono di 20 kHz non è 320 kbps.

12

In primo luogo, https://www.google.com/?q=mp3+cutoff+frequency può essere abbastanza illuminante.

In secondo luogo, quasi tutti gli MP3 sono codificati utilizzando i preset con filtri passa-basso polifase piuttosto standard. Poiché in realtà è impossibile ottenere una compressione lossless con MP3, ciò che viene perso è in realtà l'armonica più alta delle frequenze di base (vedi FFT, DCT, trasformate wavelet, ecc.); il filtro viene applicato in modo tale che i risultati della successiva analisi di Fourier dello spettro siano più coerenti con il range uditivo umano (cioè le frequenze non mascherabili/mascherate vengono eliminate dall'analisi). In realtà è impossibile per ottenere una compressione elevata senza tagliare/distorcere gravemente le frequenze più alte, poiché in realtà sono quelle che occupano la maggior parte dello spazio nel flusso di bit.

Ovviamente, senza il limite la limitazione del dominio della frequenza sarebbe meno accurata, ma si verificherebbe .Il taglio viene applicato, tra le altre ragioni, in modo che gli artefatti di compressione siano generati al di fuori del range dell'udito psicoacustico.

Come punto di riferimento, eseguire un'analisi dello spettro del flusso (in tempo reale SA con clone Winamp sarebbe sufficiente se gli intervalli di frequenza più elevati sono sufficientemente saturi, è anche possibile eseguire semplicemente uno spettrogramma se si dispone degli strumenti) e trovare il punto limite. Nell'esempio sottostante, il cutoff si verifica a 15 kHz, che mi informa che il flusso è stato originariamente compresso a 128 kbps; Direi addirittura che è possibile distinguere < = 128 kpbs stream all'orecchio con molti tipi di musica (vengono in mente drum'n'bass e altri generi di musica elettronica con molti alti).

MP3 spectrum analysis

I tagli più comuni sono: (notare che essi sono "duro" in CBR e "soft" in ABR/VBR)

  • 128 kbps: 15-16 kHz (molto udibile rock/musica elettronica "perdita di spazio" effetto)
  • 192 kbps:! ~ 19 kHz (appena udibile nella maggior parte dei casi, considerata trasparente dalla maggior parte)
  • 256-320 kbps:> ~ 20kHz (non udibile)

sì, sono consapevole del fatto che alcune persone possono sentire al di sopra di 20 kHz, ma l'effetto di mascheramento che appare nella musica più i tempi di risposta reale dai mezzi altoparlanti che nella musica attuale il taglio a 20 kHz è irrilevante per la qualità del suono.

fonte: proprio reasearch come ingegnere audio più http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/ come un riferimento aggiuntivo

Problemi correlati