2012-03-05 19 views
5

sto sviluppando un'applicazione desktop che utilizza java. questa applicazione è per i bambini delle scuole per insegnare l'inglese, dove l'utente può caricare un audio in inglese può essere in qualsiasi formato che deve essere convertito in file di testo. dove possono leggere il testo.conversione di file audio in file di testo utilizzando java

Ho trovato qualche api ma non ne sono sicuro.

http://cmusphinx.sourceforge.net/wiki/

Ho visto molte domande su StackOverflow per quanto riguarda questo, ma nessuno era disponibile. se qualcuno può aiutare su questo sarà molto grato

grazie

+4

Solo per farvi sapere, quello che state cercando di ottenere non è banale - e probabilmente non c'è una soluzione là fuori che vi garantisca una conversione al 100% ... viceversa (text2speech) è molto più semplice. Potresti voler esaminare le app/librerie di terze parti che lo fanno, non necessariamente in Java, e quindi semplicemente integrarle con esse. – Marcelo

risposta

3

Ci sono molte tecnologie e servizi disponibili per eseguire il riconoscimento vocale. Per un'introduzione ad alcune delle scelte vedi https://stackoverflow.com/a/6351055/90236.

Non sono sicuro che i risultati saranno accettabili per insegnare ai bambini l'inglese come seconda lingua, ma vale la pena provare.

3

Ciò che cerchi è attualmente rompendo tecnologia. Strumenti come cmusphinx possono rilevare le parole da un dizionario dedicato e limitato (in modo che tu possa insegnare a capire, ad esempio, 15 parole e il gioco è fatto) non puoi insegnare a capire l'inglese).

Fondamentalmente, questi strumenti cercano di trovare schemi nelle onde sonore che li alimentano. Non capiscono nulla, usano solo lo stesso algoritmo su qualsiasi cosa e poi cercano di trovare la corrispondenza più vicina. Funziona bene per insiemi di parole di piccole dimensioni, ma con l'aumentare del numero di parole, la differenza tra ciò si riduce e il lavoro diventa sempre più difficile (senza nemmeno iniziare con parole come se e meteo o C e vedere).

Quello che si potrebbe considerare è il software "ripeti dopo di me". Qui, è necessario registrare tutte le parole per il test come modelli. Quindi puoi registrare le parole dagli studenti e calcolare la differenza. Se la differenza non è troppo grande, la parola è corretta. Ma ancora: questa è una semplice ripetizione per migliorare la pronuncia - non l'inglese.

v'è un software per desktop che può capire molto inglese (ad esempio, i prodotti provenienti da Nuance, Dragon Naturally Speaking essere uno dei più importanti). Offrono soluzioni server ma quel software non è gratuito o economico se hai un budget limitato.