2014-06-18 7 views
12

Ho circa 3000+ file audio dello stesso autore. Ho bisogno di trascrivere quelle conferenze, dove l'autore ha detto di una parola particolare.Ricerca di una particolare parola pronunciata nei file audio

Quindi ho bisogno di una soluzione software, che troverà automaticamente tutti i file in cui viene detta la parola specifica. Ci può essere qualche variazione su come la parola è stata pronunciata, perché i file audio sono stati pronunciati in 15 anni.

La soluzione Free/Open Source è apprezzata.

Ho provato a cercare e ho scoperto la Sfinge. Ma non sono in grado di configurarlo per il mio progetto. Qualsiasi aiuto è molto apprezzato. Si prega di

+0

hey sei riuscito a raggiungere questo obiettivo? se sì per favore condividi come? github repo sarebbe fantastico! –

risposta

12

È possibile utilizzare CMUSphinx, un motore di riconoscimento vocale open source che supporta la localizzazione di parole chiave.

1) convertire l'audio al formato richiesto - file 16kHz 16bit mono:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav 

2) costruire e installare l'ultima pocketsphinx e sphinxbase da http://github.com/cmusphinx

3) Scarica en-us generic acoustic model

4) eseguire il rilevamento:

pocketsphinx_continuous -infile file.wav -hmm en-us -kws_threshold 1e-40 -keyphrase "what you need to detect" -time yes 

Stampa le parole chiave rilevate e i loro tempi. Per la massima precisione di rilevamento è possibile regolare kws_threshold.

+0

Grazie Nikolay per la tua risposta. Dal momento che questo modello acustico sarà generico, come posso creare un modello acustico basato sui file audio già registrati dell'altoparlante? –

+0

Per lo spotting delle parole chiave NON è necessario il modello dipendente dall'altoparlante, non migliorerà significativamente le cose. Nel caso in cui si desideri ancora adattarlo, esiste un tutorial di adattamento del modello acustico http://cmusphinx.sourceforge.net/wiki/tutorialadapt –

+0

La parola chiave spotting continuerà a funzionare, se la parola chiave che sto cercando non è nel dizionario standard inglese ? –

Problemi correlati