20

sto sviluppando un sito web, e vorrei aiutare le persone non vedenti la utilizzi per la voce, così che è possibile usare:JavaScript Speech-to-Text per le persone non vedenti

  • Text-to-speech , di dare alcuni posibilities all'utente
  • Speech-to-text, per permettere agli utenti di usare la sua voce per selezionare una

ho già alcune librerie di text-to-speech JavaScript (come speak.js), ma ora ho bisogno di una buona sintesi vocale. Ci sono alcune soluzioni per questo scopo (come speechapi), ma usano applet Java o Flash, e voglio dipendere solo da JavaScript, per evitare i plugin.

Sto provando l'input vocale di HTML5 con x-webkit-speech e Google Chrome, ed è buono, ma è necessario fare clic su un'icona (e i non vedenti non possono usare bene il mouse). È possibile usare x-webkit-speech premendo un tasto? Conosci qualche API alternativa (JavaScript)?

Grazie!

+0

+1 eccellente domanda – Blaster

+3

La navigazione vocale non dovrebbe essere parte del browser, invece del sito Web? – Bergi

+1

@Bergi La navigazione potrebbe essere una responsiilità del browser, ma il mio sito Web è più complesso. Ha dei giochi semplici per migliorare le tue capacità cerebrali, e la mia intenzione è quella di adattare alcuni di loro ai non vedenti, quindi il browser non può gestire i miei giochi HTML5. – sgmonda

risposta

2

Google Translate è un ottimo motore di sintesi vocale. Ho letto un testo con esso. Per esempio si dispone di un testo: welcome to Stack overflow si può chiamare in questo modo

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input 

quindi utilizzare l'audio browser per giocare

per l'input vocale è possibile attivare manuale processo di ascolto, vedi qui http://code.google.com/chrome/extensions/experimental.speechInput.html

+0

Ma poi, l'utente dovrebbe installare un'estensione per Chrome. È una possibilità, ma non mi piacerebbe dipendere da un'estensione. Idealmente, l'utente avrebbe solo bisogno di aprire il suo browser (ora, Chrome è l'unico che supporta gli input vocali, ma questo è nelle specifiche HTML5, quindi tutto il browser lo supporterà con il tempo) – sgmonda

3

È possibile usare x-webkit-speech premendo un tasto?

Secondo la presente post e questo post non si può ignorare l'inizio del discorso facendo clic sul microfono.

Ciò che il linguaggio di x-webkit sta facendo è utilizzare le funzionalità di acquisizione audio di HTML5 e inviare l'audio ai server di Google per l'elaborazione, restituendo i risultati in JSON. Questo blogger has reversed engineered it. Potresti sviluppare una libreria JavaScript che cerca la pressione di un tasto per iniziare a catturare l'audio su browser abilitati HTML5 e inviarlo al servizio di Google o a quello che hai creato. Il lato negativo dell'utilizzo del servizio di Google è che si tratta di un'API non supportata e soggetta a modifiche in qualsiasi momento. Lo svantaggio di sviluppare il proprio servizio è che può essere costoso da sviluppare e mantenere.

Conosci qualche API alternativa (JavaScript)?

Questo post e questo post elenca alcuni servizi disponibili per il riconoscimento vocale. Non ho visto Nuance elencato. Potresti essere in grado di utilizzare il Dragon Mobile SDK per questo. E potresti voler controllare su ISpeech.

Problemi correlati