2012-07-13 20 views
5

Voglio testare il mio algoritmo di genere musicale nel set di dati pubblici per confrontarlo con altri algoritmi preesistenti. Nel caso di MIREX, tutti i dati non sono disponibili. Ho trovato che il set di dati GTZAN è disponibile in un collegamento (marsyas.info/download/data_sets) Ma, non è disponibile per me ora.Set di dati del genere musicale GTZAN

Sai come posso ottenere questi dati? Perché uso altre funzionalità oltre all'MFCC, quindi ho bisogno di annotazioni di genere e musica.

Grazie in anticipo.

risposta

1

Sto anche cercando un tale punto di riferimento.
Trovo che questo sia in un articolo intitolato "Dal suono al 'Senso' via Feature Extraction e Machine Learning - Derivazione alto livello descrittori per la caratterizzazione di Musica":

Ci sono alcuni sforzi attualmente in corso nella musica Information Retrieval Community per compilare grandi archivi di musica con etichetta che possono essere resi disponibili a tutti i ricercatori interessati senza problemi di copyright. Esempi degni di nota sono Masa- taka Goto's RWC Music Database (http://staff.aist.go.jp/m.goto/RWC-MDB), il progetto IMIRSEL (International Music Information Retrieval System Evaluation Laboratory at) l'Università dell'Illinois a Urbana-Champaign (http://www.music-ir.org/evaluation - si veda anche [12]), e la nuova FreeSound Initiative (http://freesound.iua.upf.edu) .

ma non ho trovato nulla di utile da loro. La procedura per ottenere una copia del primo database citato è here ma sembra piuttosto sofisticato!

1

Sembra che si possa desiderare lo Million Songs Dataset, che ha, beh, un milione di canzoni, con caratteristiche audio, tag, testi e così via, relique di Echonest e Labrosa. Ovviamente, questo presume che tu stia lavorando su metadati e trascrizioni musicali.

Se stai cercando l'audio non elaborato ... è un'altra questione. Non so se desideri pubblicare, nel qual caso la legge sulla proprietà intellettuale potrebbe essere un fattore più significativo. Ma per i test privati, sospetto che potresti semplicemente utilizzare i file della tua libreria musicale (ad esempio, i download di iTunes hanno già un tag di genere per testare il tuo algoritmo).

Disclaimer: Io non sono un avvocato. Prendi il mio consiglio legale a tuo rischio.

+0

Non penso che l'MSD abbia testi. – pratnala

6

EDIT: ora sembra che la pagina di Marsyas sia ospitata allo marsyasweb.appspot.com e che sia possibile trovare i collegamenti al database GTZAN nella pagina secondaria data sets.

Stavo anche cercando il set di dati GTZAN per il mio progetto universitario e ho scoperto che http://marsyas.info non funziona, quindi ho usato google web cache for marsyas.info/download/data_sets (controllalo per maggiori informazioni). Fortunatamente, i set di dati GTZAN sono ospitati al numero http://opihi.cs.uvic.ca e tu puoi download them!

Ma essere consapevoli di licenza prima di utilizzare i set di dati (informazioni da Marsia cache pagina di download):

Questo set di dati è stato utilizzato per la carta ben noto nella classificazione di genere "classificazione Genere musicale di segnali audio" di G Tzanetakis e P.Cook in IEEE Transactions su Audio and Speech Processing 2002.

Sfortunatamente il database è stato raccolto gradualmente e molto presto nella mia ricerca quindi non ho titoli (e ovviamente nessun permesso di copyright ecc.). I file sono stati raccolti nel 2000-2001 da una varietà di fonti, tra cui CD personali, radio, registrazioni di microfoni, al fine di rappresentare una varietà di condizioni di registrazione. Tuttavia, lo ho fornito ai ricercatori su richiesta principalmente per scopi di confronto, ecc. Si prega di contattare George Tzanetakis ([email protected]) se si intende pubblicare risultati sperimentali utilizzando questo set di dati.

Il set di dati è costituito da 1000 tracce audio ciascuna di 30 secondi. Contiene 10 generi, ciascuno rappresentato da 100 tracce. Le tracce sono tutti file audio a 16 bit Mono a 22050 Hz in formato .wav.

Forse si sarà interessati anche ad altri set di dati come Magnatagatune - http://tagatune.org/Magnatagatune.html.

Problemi correlati