2011-09-22 7 views

risposta

9

Ci sono un sacco di librerie IOS commerciali per il riconoscimento vocale. I nomi che continuo a sentire sono Nuance, iSpeech e Yapme. Ciascuno offre il riconoscimento vocale cloud (fuori dal dispositivo) e una libreria client e SDK da integrare nella tua app.

Nuance sembra sostenere Spagnolo - http://blog.dragonmobileapps.com/2011/01/mobile-app-developer-dragon-mobile-sdk.html

... si può speech-abilitare la vostra applicazione per l'inclusione di inglese americano e britannico, spagnolo europeo, francese europeo, tedesco, italiano e giapponese --- con ancora più lingue alla spina per il 2011!

e ora Nuance offre agli sviluppatori l'accesso gratuito - http://www.masshightech.com/stories/2011/09/26/daily13-Nuance-tweaks-mobile-dev-program-with-free-access-to-Dragon.html

iSpeech è propensi a sostenere Spagnolo - http://www.ispeech.org/developers/iphone

SDK per dispositivi mobili di iSpeech supportano 27 TTS e ASR (grammatica definita) lingue e 15 lingue per il riconoscimento vocale di dettatura a mano libera.

Yapme, mi dispiace, io non sono sicuro - http://yapinc.com/speech-cloud.html

4

dare uno sguardo qui: http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

E 'il Chrome browser vocale per cercare ...... lo si può fare in Objective-C. Prova go go.com sul browser Chrome e se lo spagnolo è riconosciuto, vinci! :)

Si può facilmente utilizzare:

- (void) SpeechFromGooglezzz { 
    NSURL *url = [NSURL URLWithString:@"https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=en-US"]; 

    ASIFormDataRequest *request = [ASIFormDataRequest requestWithURL:url]; 
    NSString *filePath = [NSString stringWithFormat:@"%@%@", [[NSBundle mainBundle] resourcePath], @"tmpAudio.flac"]; 

    NSData *myData = [NSData dataWithContentsOfFile:filePath]; 
    [request addPostValue:myData forKey:@"Content"]; 
    [request addPostValue:@"audio/x-flac; rate=16000" forKey:@"Content-Type"]; 
    [request startSynchronous]; 

    NSLog(@"req: %@", [request responseString]); 
} 

Ricordate che è necessario registrare un file FLAC bitrate 16000! O niente!

Google risponde con un json contenente le parole.

spero che questo aiuti.

+0

La mia comprensione è che Google non fornisce questi servizi per uso commerciale ad eccezione dei client Chrome e Android. Non vorrei creare un'applicazione commerciale utilizzando quelle API di IOS. Google potrebbe facilmente chiudere la tua applicazione. Se si tratta solo di un prototipo o di un esperimento, potresti farla franca utilizzando i servizi di Google, ma non farei affidamento su di essi per scopi commerciali. –

+0

Giusto, ma Fernando non ha specificato se l'app è commerciale o no! :) – elp

+0

Vero, un buon link per vedere è http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ –

1

Ho scritto una libreria client per le API di Google Speech. Funziona meglio con iOS e supporta anche altri sistemi Unix-like:

Edit: provare qui: https://github.com/H2CO3/libsprec

Problemi correlati