Per acquisire un input vocale in formato libero (anziché un elenco definito di valori possibili), è necessario utilizzare il tipo di slot AMAZON.LITERAL
. Il Amazon documentation for the Literal slot type descrive un caso d'uso simile al tuo, in cui viene creata un'abilità per prendere qualsiasi frase e postarla su un sito di social media. Ciò si ottiene creando un intento StatusUpdate:
{
"intents": [
{
"intent": "StatusUpdate",
"slots": [
{
"name": "UpdateText",
"type": "AMAZON.LITERAL"
}
]
}
]
}
Dal momento che utilizza il tipo di slot AMAZON.LITERAL
, questo intento potrà catturare qualsiasi frase arbitrario. Tuttavia, per garantire che il motore di riconoscimento vocale esegua un lavoro decente nel catturare frasi del mondo reale, è necessario fornire una serie di espressioni di esempio che assomigliano al tipo di cose che ci si aspetta che l'utente possa dire.
Dato che nello scenario descritto, si sta cercando di catturare molto frasi dinamiche, ci sono un paio di cose nella documentazione si vorrà prendere in considerazione in più per:
Se si utilizza il tipo AMAZON.LITERAL per raccogliere forma libera testo con ampie variazioni nel numero di parole che potrebbero essere nella fessura, nota seguente:
- Coprire questa gamma (minimo, massimo e tutti in B tra) sarà richiedono un set molto grande di campioni. Prova a fornire diverse centinaia di campioni o più per indirizzare tutte le variazioni nelle parole con valore di slot come annotate sopra.
- Mantieni le frasi all'interno degli slot in modo che gli utenti possano pronunciare l'intera frase senza bisogno di mettere in pausa la frase .
Lengthy ingresso del può portare a esperienze minore precisione, evitando così progettazione di un'interfaccia lingua parlata che richiede più di qualche parole per un valore di slot. Una frase che un utente non può parlare senza la pausa è troppo lunga per un valore di slot.
Detto questo, ecco le esternazioni esempio campione dalla documentazione, ancora una volta:
StatusUpdate inviare l'aggiornamento {arrivato | UPDATETEXT}
StatusUpdate inviare l'aggiornamento {cena | UPDATETEXT}
StatusUpdate inviare l'aggiornamento {fuori a pranzo | UPDATETEXT}
... (più campioni mostrando frasi wi TH 4-10 parole)
StatusUpdate inviare l'aggiornamento {intenzione di fermarsi al negozio di alimentari di questa sera | UPDATETEXT}
Se si forniscono abbastanza esempi di diversa lunghezza per dare un quadro preciso della gamma di pronostici attesi dall'utente, quindi il tuo intento sarà in grado di catturare con precisione frasi dinamiche in casi d'uso reali, a cui puoi accedere nello slot UpdateText
. Sulla base di questo, dovresti essere in grado di implementare un intento specifico per le tue esigenze.
Ciao Alex, grazie per la tua risposta. C'è un comando incorporato, 'Alexa, Simon dice ..' che ripete qualunque cosa l'oratore parli dopo. Mi stavo chiedendo come sia salvato l'input vocale non elaborato in quel caso. –
Gli sviluppatori di terze parti non hanno attualmente accesso a tutta la potenza di Alexa, puoi vederlo in alcune delle app di Amazon come la ricerca di musica e alcune applicazioni di alto profilo come Uber che possono ottenere la posizione degli utenti, ma un generale gli sviluppatori di app non possono. Spero che questo cambi in futuro con la maturazione della piattaforma. –
Questa risposta non è vera: è possibile implementare il tipo di slot 'AMAZON.Literal', che consente di acquisire input di forma libera. Tuttavia, devi fornirgli una serie di esempi di input per addestrarlo su quale tipo generale di input aspettarsi. –