2010-07-05 7 views
6

Ho un flusso audio e vorrei estrarre parole (parole) da esso. Quindi, per esempio avendo audio.wav vorrei ottenere 001.wav, 002.wav, 003.wav, ecc dove ogni XXX.wav è una parola.Libreria per l'estrazione di parole (parlato) dal flusso audio?

Sto cercando una libreria o un programma per farlo - la piattaforma non ha importanza, ma preferisco la soluzione open-source.

Grazie in anticipo per l'aiuto.

risposta

2

Nuance, la società che produce Dragon Naturally Speaking, ha un numero di Software Development Kits.

Il Audio Mining kit sembra soddisfare le vostre esigenze:

Dragon NaturallySpeaking SDK AudioMining è un toolkit di riconoscimento speech-indipendente che permette l'indicizzazione del 100% delle informazioni discorso all'interno dei file audio. La tecnologia utilizza il riconoscimento vocale accurato per convertire i file audio in testo XML con le informazioni relative al timestamp . È possibile integrare con prodotti di ricerca testo standard su abilitare l'accesso rapido a contenuto audio specifico .

La sintesi vocale + i metadati sono di gran lunga la parte più difficile da ottenere. Una volta che hai parlato + metadati, l'estrazione delle parole come singoli file audio è much more straightforward.

+0

NB Il kit di estrazione audio menzionato viene fornito con il seguente avvertimento: "** La tecnologia Dragon AudioMining è progettata specificamente per l'inglese americano e non è destinata alla trascrizione di riunioni o interviste. **" – LeeGee

+0

@greenoldman ha preferito un open-source soluzione –

+0

È molto difficile trovare informazioni su Nuance AudioMining online. E sembra contraddittorio, dal momento che la trascrizione di incontri e interviste è stata esplicitamente menzionata nel lancio del prodotto nel 1999: https://www.youtube.com/watch?v=yagvFY_rUwM – Christoph

Problemi correlati