Perché e come realizzare uno skill Alexa [GUIDA]

Gli assistenti vocali consentono di fare molto più di quanto potremmo immaginare in prima battuta e, sia che si tratti di registrare un rapido promemoria che di ordinare del cibo, ci permettono di farlo anche molto più velocemente e con maggior semplicità rispetto all’utilizzo di una applicazione mobile.

E’ quindi evidente che l’utilizzo della tecnologia di riconoscimento vocale è la prossima grande frontiera. Amazon Alexa, tecnologia oggi in testa alle classifiche con una quota di mercato del 73%, già consente di fare innumerevoli azioni e varie previsioni indicano che entro il 2020 il 50% di tutte le ricerche sarà vocale. Ogni anno Alexa stabilisce nuovi record di vendita su Amazon ed è anche diventata la Top app gratuita su Google Play e Apple Store (poiché richiede la sua applicazione mobile per configurarlo per la prima volta). E se ciò non bastasse non solo i dispositivi echo, ma anche altri dispositivi domestici intelligenti di mercato che sono in cima alle classifiche di vendita, sono dispositivi abilitati Alexa.

6 motivi per cui il riconoscimento vocale sarà la prossima grande frontiera

  1. Consente di fare quasi tutto ciò che può essere realizzato utilizzando un’applicazione mobile. Avendo la capacità di sviluppare competenze personalizzate siamo ad esempio in grado di collegarlo al nostro database o di eseguire praticamente tutte le operazioni che possono essere fatte da un sito web o un’app mobile.
  2. Rappresenta il modo più veloce di effettuare una qualsiasi opzione. Se ad esempio un utente volesse controllare le sue riunioni del giorno successivo non avrà più bisogno di utilizzare app diverse, ma potrà accedere direttamente all’informazione con un singolo comando vocale.
  3. Mani libere e multitasking: l’utente può eseguire delle attività on line mentre, contemporaneamente, fa altro (come l’uso di uno strumento, cucinare, leggere, fare esercizio fisico, guidare l’auto, ecc.)
  4. Dà all’utente la possibilità di eseguire specifici compiti stando lontano dallo schermo
  5. Rappresenta il modo più naturale per interagire con un computer: per le persone anziane che hanno difficoltà ad imparare ad usare uno smart phone l’utilizzo dei comandi vocali si rivela essere la cosa più semplice in quanto rappresenta il modo più naturale di comunicare
  6. Rappresenta la scelta migliore rispetto agli smartphone per non vedenti o disabili: un assistente vocale è in grado di eseguire qualsiasi attività che uno smartphone può fare, ed è quindi quanto di meglio per i non vedenti o le persone con disabilità che non hanno più bisogno di cercare di utilizzare un dispositivo di input basato su uno schermo per ottenere le informazioni volute o fare altre attività

Oggi esistono più di 70.000 skill pubblicati su Alexa Skills Store, e sono in costante aumento. Gli skill più popolari hanno già circa 10.000 recensioni e ne ricevono circa 15 nuove al giorno, immaginate i numeri relativi al loro utilizzo !

Volete realizzare uno skill Alexa ?

Lavorare sull’idea: avete un’idea e volete realizzare il relativo skill Alexa ? La cosa più importante è iniziare passo dopo passo, identificando in primo luogo il bisogno che questo skill soddisferà ed elencando in un documento i punti principali dell’idea.

Controllare la concorrenza: fate una ricerca nell’Amazon Alexa Skill Store per verificare l’esistenza di skill analoghi relativi alla vostra idea per capire come migliorarla o per identificare funzionalità aggiuntive da fornire agli utenti.

Identificare la vostra audience: essendo la voce è il modo più naturale di comunicare avrete a che fare con utenti di tutte le età, dai più giovani ai più anziani. Comprendendo le esigenze del vostro pubblico potrete indirizzare al meglio lo sviluppo. Alcuni skill sono infatti progettati per i bambini, per l’apprendimento ed il gioco, mentre altri per fornire aiuto agli anziani. Skill generali possono invece avere un vasto pubblico ed essere utilizzate da chiunque.

Scegliere la squadra giusta: Ora che avete l’dea ed avete controllato il mercato è tempo di iniziare a realizzarla. La scelta del giusto team è la parte più importante ed,
essendo un campo abbastanza nuovo , non ci sono ancora così tanti sviluppatori di skill Alexa come per lo sviluppo di applicazioni Web o Mobile. Un buon team di sviluppo di skill Alexa Skill dovrebbe comprendere:

  1. Disegnatore di Voice User Interface
  2. Sviluppatore (Python/Node.js etc)
  3. Specialista di Quality Assurance
  4. Project Manager

Generare ricavi con il vostro skill: Amazon fornisce la funzione di acquisto In-Skill, ed ora c’è anche Consumable con cui è possibile fornire un’opzione di pagamento ripetitivo per un servizio/prodotto digitale che un utente può acquistare, utilizzare e riacquistare.

Aspetti su cui concentrarsi nel costruire uno skill Alexa

Concentrarsi sui punti seguenti dovrebbe consentirvi di realizzare una buona interfaccia utente vocale (VUI – Voice User Interface). Ogni skill dovrebbe averne una, gli utenti non dovrebbero essere costretti ad ascoltare contenuti troppo lunghi, dovrebbero ottenere l’aiuto giusto al momento giusto, lo skill dovrebbe essere in grado di fornire dati adeguati ed adatti all’utente ed il flusso del dialogo dovrebbe essere scorrevole come una vera conversazione.

  • Definizione dell’invocazione: L’invocazione è usata per avviare uno skill. Questa deve essere molto chiara e significativa, qualcosa che l’utente possa ricordare in quanto dovrà chiamare il nome dello skill per avviarlo. Idealmente il nome di uno skill dovrebbe essere composto da almeno due parole e corrispondere all’invocazione completa, per esempio “Alexa, apri Mio Servizio”. Qui “Mio Servizio” rappresenta il nome dello skill, mentre alcune parole diverse possono essere usate al posto di “apri”, come “chiedi” (ampiamente usato), “inizia”, “fai”, “lancia”, “carica”, ecc.
  • Intenti: Questa è una terminologia tecnica, un intento rappresenta ogni funzione che il nostro skill svolgerà. Gli utenti possono invocare intenti diversi per eseguire funzioni diverse. Per esempio se uno skill accende/spegne la luce può avere un intento per accendere/spegnere ed un intento per aggiungere un nuovo utente.
  • Utterances: sono i sinonimi delle frasi che potremo utilizzare per richiamare intenti diversi. Mentre si costruisce uno skill Alexa è possibile scrivere manualmente gli enunciati delle frasi che l’utente potrà dire per richiamare un particolare intento, o una particolare funzionalità all’interno del nostro skill. E sarà necessario scriverne quante più possibile per ottimizzare al massimo la comprensione precisa degli intenti degli utenti. Ad esempio se lo skill in questione fornisse gli orari della prima colazione di un hotel i diversi enunciati potrebbero essere:
    “Qual’è l’orario di colazione ?”
    “A che ora inizia il servizio di prima colazione ?”
    “Quando è la prima colazione ?”
    “A che ora termina il servizio di prima colazione ?”
    “Vi prego di farmi sapere gli orari di colazione”, ecc.

    Anche se Alexa è in grado di comprendere automaticamente frasi simili o corrispondenti è bene fornire più espressioni possibile.
  • Musica: a differenza delle applicazioni mobili gli skill di Alexa sono basati sulla voce e quindi la musica gioca un ruolo importante. Iniziare lo skill con una musica adeguata che cambia secondo il contesto lo rende più avvincente e piacevole da utilizzare.

Pubblicazione dello skill

Nel pubblicare il vostro skill:

  • Beta Test: La Amazon Developer Console ha ora una nuova opzione “Beta Test” che permette di condividere il nuovo skill con “utenti amici” e continuare a modificarlo e/o integrarlo prima della sua pubblicazione a tutti gli utenti.
  • Siate molto chiari nell’indicare agli utenti ciò che il nuovo skill può fare in modo da allineare le loro aspettative.
  • Lo skill dovrebbe incoraggiare gli utenti a lasciare recensioni in modo da approfondire il più possibile quali sono le loro reali aspettative.
  • Seguite le evoluzioni delle tecnologie Voice ed implementate gli skill nel miglior modo possibile continuando a migliorarle ed aggiornarle.

Altri aspetti tecnici

Progettare per la tecnologia Voice è molto diverso dal progettare per applicazioni classiche che utilizzano uno schermo. Anziché pensare al flusso applicativo e all’interazione con l’utente nella modalità utilizzata mentre si sviluppano applicazioni mobili o siti web, il modo migliore per progettare skill Alexa è quello di definire la
conversazione con lo skill Alexa, conversazione che inizierà quando l’utente dirà “una specifica frase” di invocazione, alla quale Alexa risponderà, e così via.

La progettazione di una bozza di flusso di dialogo aiuta molto nel rendere chiaro l’intero scenario. Procedendo poi per raffinamenti successivi si costruisce una buona interfaccia utente vocale.

Concludiamo dicendo che per la parte di sviluppo vero e proprio Amazon fornisce ASK (Alexa Skill Kit) con cui è possibile sviluppare skill per Alexa. Approfondiremo l’utilizzo di questo kit in un futuro articolo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.