Talk To Me Computer: il controllo vocale sta decollando

Se i pacchetti imprevisti iniziano a comparire alla tua porta, potresti volere avere una parola con uno dei tuoi dispositivi intelligenti.

All'inizio di questo mese, un bambino di sei anni a Dallas ha chiesto alla sua famiglia Amazon Echo altoparlante intelligente per una casa delle bambole. E Alexa, l'assistente artificiale simile a Siri di Amazon, prontamente ordinato uno a casa loro.

Un notiziario televisivo di San Diego raccolse la storia e inavvertitamente la ripeté quando una delle ancore commentò: "Adoro la bambina, che dice 'Alexa mi ordina una casa delle bambole'". Ascoltando questo, molti altri dispositivi Amazon nelle case di tutto il mondo. San Diego ha tentato di comprare più case delle bambole.

CW6 San Diego notizia sull'acquisto accidentale di casa delle bambole di Alexa.

{youtube}oI2KLIULjXc{/youtube}

La storia potrebbe sembrare tristemente familiare a chiunque abbia provato a conversare con la Siri di Apple o con la Cortana di Microsoft. I nostri dispositivi sono diventati abbastanza bravi ad ascoltarci, ma questo non significa sempre che capiscano.

I ricercatori di Microsoft hanno recentemente individuato questo come un potenziale problema con le interfacce parlanti di oggi: sono commercializzati come assistenti "intelligenti", con scherzi intelligenti e conoscenze mondane, ma spesso ci frustrano con la loro mancanza di buon senso.


innerself iscriviti alla grafica


In un piccolo studio, i ricercatori hanno scoperto che le persone che hanno continuato a parlare con i loro assistenti digitali nel corso del tempo erano quelle che avevano iniziato con le aspettative più basse.

Che cosa fa realmente un'interfaccia vocale?

Quando parli con un'interfaccia vocale, deve:

  • "Ascolta" il suono della tua voce e distinguilo dal rumore di fondo
  • capisci dove ogni parola inizia e finisce, ignorando i tuoi "umms" e "ahhs"
  • abbinare il suono di ogni parola a una parola nel dizionario, scegliendo quella giusta dal contesto se ci sono omofoni
  • interpretare correttamente il significato dell'intera frase
  • generare una risposta significativa e utile che corrisponda alla tua richiesta.

Ognuna di queste è una complessa sfida tecnica e diverse aziende tecnologiche hanno compiuto progressi in diversi settori.

Google Now è in grado di fornire risposte pertinenti a un'ampia gamma di richieste perché beneficia dei dati di Google relativi al Web e alle tue attività personali, se utilizzi i servizi di Google.

Amazon Echo è particolarmente indicato per ascoltare le tue richieste da una stanza rumorosa, grazie a un array di microfoni a campo lontano con cancellazione del rumore. Certo, è anche bravo a fare acquisti tramite Amazon.

Nel corso degli ultimi anni, le interfacce vocali sono diventate molto più utili per comprendere il linguaggio quotidiano o "naturale" piuttosto che solo comandi stilati e accuratamente formulati. Sono ancora più bravi a gestire domande semplici, come "chi sta giocando nell'Australian Open?", E tendono a lottare con richieste più complicate, come "chi sta giocando all'Australian Open per la prima volta quest'anno?" E il follow-up? domande, come "pioverà durante le finali?".

La situazione è ancora più mista per le lingue diverse dall'inglese: mentre Siri supporta più lingue e dialetti 40, finora Alexa è disponibile solo in inglese e tedesco. Ma tutte queste caratteristiche stanno migliorando costantemente.

Dove le interfacce vocali balbettano

Così le interfacce vocali prenderanno presto il controllo di tutta la nostra tecnologia, come previsto nel film Il suo? Gartner, una società di ricerca tecnologica, ha previsto che entro il prossimo anno, 30% delle nostre interazioni con la tecnologia saranno conversazioni con interfacce vocali.

Ma le interfacce vocali hanno limitazioni e non tutte possono essere risolte con una tecnologia migliore.

La voce è un mezzo centrale per interfacciarsi con la tecnologia nel film di Spike Jonze Her.

{youtube}ne6p6MfLBxc{/youtube}

L'inquinamento acustico è uno dei principali ostacoli. Il tuo dispositivo può distinguere ciò che stai dicendo dal rumore di fondo intorno a te? La tecnologia può aiutare in questo, compresa la riduzione del rumore, il riconoscimento vocale personalizzato e la lettura labiale.

Ma per quanto riguarda il rumore di fondo che stai creando per gli altri parlando al tuo dispositivo intelligente? Immagina una persona seduta accanto a te in ufficio - o su un aereo - che chiacchiera con Siri mentre stai cercando di leggere, e puoi capire perché le interfacce vocali potrebbero non essere sempre socialmente accettabili.

Un'altra serie di problemi deriva dalle esigenze mentali delle interfacce vocali. Imparare a usare un sistema basato sulla voce può essere difficile, specialmente se non c'è schermo, come con Amazon Echo.

Se hai mai chiamato una banca o una compagnia telefonica, sai che la miserabile combinazione di concentrazione e noia derivante dall'ascolto di una voce sintetizzata elenca tutte le tue opzioni mentre aspetti quella di cui hai bisogno e prova a non mescolarle su. Le interfacce grafiche tradizionali evitano questo problema mostrandoti le opzioni disponibili e permettendoti di toccare velocemente la tua scelta.

Dopo aver imparato i comandi vocali, utilizzarli può essere fonte di distrazione. I ricercatori hanno scoperto che i comandi vocali deraglia il tuo treno di pensieri più di un mouse e una tastiera.

Ciò è particolarmente pericoloso per le interfacce vocali in auto: una coppia di studi dell'Università dello Utah ha rilevato che i conducenti lo erano distratto per un massimo di 27 secondi dopo aver usato i comandi vocali.

Università dello Utah / Fondazione AAA per la ricerca sulla sicurezza del traffico sulla distrazione del guidatore.

{vimeo}108281698{/vimeo}

Trovare la sua voce?

Quindi è improbabile che le interfacce vocali subentrino completamente, ma troveranno utili nicchie nelle nostre vite. Sono già comuni nelle auto, dove si spera che diventino meno distraenti man mano che la tecnologia migliora.

In cucina, puoi chiedere ad Alexa di parlarti di una ricetta o aggiornare la tua lista della spesa mentre le tue mani sono impegnate a cucinare. Nella realtà virtuale e aumentata, le interfacce vocali ti consentono di controllare il sistema quando non riesci a vedere le tue mani.

Nell'apprendimento delle lingue, possono essere utilizzati per praticare la pronuncia. Ancora più importante, le interfacce vocali aiutano gli utenti con problemi motori, RSI o dislessia a superare le loro disabilità.

Le interfacce vocali sono una tecnologia tanto attesa e ci sono buone ragioni per pensare che il loro tempo sia finalmente arrivato. Ricorda solo che potrebbero non essere ancora così intelligenti come sembrano. E potresti voler inserire un codice PIN negli acquisti vocali se i bambini sono in giro.

The Conversation

Circa l'autore

Fraser Allison, candidato al dottorato di ricerca in interazione uomo-macchina, Università di Melbourne

Questo articolo è stato pubblicato in origine The Conversation. Leggi il articolo originale.

Articoli correlati

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market e Amazon