2011-09-05 36 views
16

Ho un file audio (conversazione telefonica registrata di 2 persone). Ho bisogno di separare automaticamente le voci di 2 altoparlanti. Sono nuovo nel riconoscimento vocale e ho visto il modulo wave di python ma non ho trovato alcuna informazione fruttuosa.Riconoscimento altoparlante Python

Si prega di aiutare come iniziare. Inoltre, per favore suggeriscimi librerie python gratuite che mi aiuteranno a risolvere il problema.

risposta

13

Il compito della separazione degli altoparlanti non è un compito di riconoscimento vocale, è un compito di riconoscimento degli altoparlanti. Nella comunità del discorso questo compito è anche noto come diarizzazione dell'altoparlante. Ci sono diversi pacchetti per diarization altoparlante e il riconoscimento speaker disponibili per Python:

SIDEKIT from LIUM

Bob toolkit from Idiap

Speaker diarization from ISCI

Nel caso in cui non si è limitato a Python, ci sono altri:

LIUM speaker diarization

Speaker recognition setup in Kaldi. Include i-vettori basati su DNN all'avanguardia.