Vediamo come funzionano gli assistenti vocali
11 Gennaio 2020Stanno entrando in tutte le case con gli smart speaker, chiamati anche altoparlanti intelligenti, e se non li abbiamo già comprati ci capita sempre più spesso di trovarli in casa dei nostri amici.
Rispondono alle domande, eseguono azioni come comandare la televisione o spegnere le luci, sicuramente sostituiscono lo stereo per ascoltare la musica.
Sono gli assistenti vocali, una specie di scatola magica elettronica che sembra comprendere quello che diciamo e rispondono alle nostre domande.
Ma come funzionano gli assistenti vocali?
Gli assistenti vocali non sono scatole magiche, ma dei sistemi software che usano le nuove tecnologie di intelligenza artificiale per riconoscere le frasi che pronunciamo, trasformarle in ricerche su internet per darci delle risposte, o per eseguire operazioni con i nostri elettrodomestici o elementi della casa.
Scorciatoie
Scopriamo come funzionano gli assistenti vocali
Ricordo che più di 20 anni fa uscirono i primi software a cui potevi dettargli le parole da scrivere, il più famoso era ViaVoice di IBM.
Mi interessai un po’ al funzionamento tecnico più per curiosità che per un motivo professionale.
Per semplificare un po’ la spiegazione, questi software andavano addestrati leggendo delle frasi che apparivano sullo schermo, e successivamente associavano le sillabe lette con le forme di onde sonore corrispondenti.
Da quei primi pionieristici i passi avanti sono stati immensi.
Gli assistenti vocali di oggi riconoscono sempre le forme d’onda prodotte dalla voce e le associano alle sillabe corrispondenti.
Dietro a questi strumenti c’è un enorme database che viene consultato per fare questa associazione, che restituisce la sequenza di parole pronunciate.
Questa sequenza di parole viene poi interpretata da un sistema di intelligenza artificiale, più o meno come quando cerchiamo delle cose su Google per interpretare la frase scritta, che restituisce all’assistente vocale l’operazione da eseguire.
A fronte di determinate operazioni indicate dalle parole, che chiamiamo parole chiavi, l’apparecchio elettronico è programmato ad eseguire operazioni predeterminate.
Se avete un telefono Android conoscerete di sicuro l’assistente vocale di Google.
Quando diciamo “Hey Google” il telefono riconosce queste 2 parole come comando per far partire l’assistente vocale, che è stato programmato ad esempio per effettuare telefonate senza toccare il telefono, e continuando con “Chiama casa”, l’assistente riconosce la parola “Chiama” come operazione per far partire la telefonata, e cerca “casa” nella rubrica; se la trova fa partire automaticamente la chiamata dal vostro smartphone.
Quali sono gli assistenti vocali più utilizzati
Al momento gli assistenti vocali più utilizzati sono quello di Google, Hey Google, che è presente su tutti i telefoni Android, ed Amazon Alexa che è presente negli speaker e accessori Amazon (puoi vederli cliccando su questi link: Amazon Echo, Echo Plus, Echo Dot, Echo Flex e Echo Show).
Anche Google ha i suoi accessori (che puoi vedere cliccando su questi link: Google Home, Google Home Mini, Google Nest Mini e Google Nest Hub) ma sono sicuramente meno venduti, almeno in Italia, rispetto ai dispositivi di Amazon.
Ci sono poi gli assistenti vocali di Apple e Microsoft, che hanno i loro appassionati.
L’assistente vocale di Apple si chiama Siri, e si attiva pronunciando “Hey Siri”. É disponibile praticamente in tutti gli apparecchi elettronici della Apple, dall’Apple Watch alla Apple TV oltre che, ovviamente, sugli iPhone.
L’assistente vocale di Microsoft si chiama Cortana, ed è presente i tutti i sistemi operativi Windows e sulla console da gaming XBox.
Oltre a queste 4 aziende di assistenti vocali per il mercato consumer che si sono imposti e che sono diventati popolari non ce ne sono, ci sono piccole aziende che lavorano su soluzioni anche molto interessanti, ma che per un motivo o per un altro non sono riusciti a crearsi un vero e proprio mercato.
Altri tipi di assistenti vocali li possiamo trovare sulle automobili, specialmente quelle di fascia alta, dove le funzionalità dell’assistente vocale sono limitate all’uso automobilistico, programmati perciò per accendere fanali, cambiare stazione della radio o gestire il riscaldamento dell’abitacolo.
Cosa possiamo fare con gli assistenti vocali
L’assistente vocale di per se non può far molto, la potenzialità di questi dispositivi si esprime quando vengono associati ad apparecchi ed elettrodomestici per la casa.
Ad esempio sono sempre più numerose le Smart TV che possono collegarsi agli assistenti vocali, o motori elettrici per le tapparelle, fino ai dispositivi per il comando delle luci di casa.
Possiamo accendere e spegnere la tv, cambiare canale, alzare e abbassare il volume semplicemente parlando alla televisione, oppure possiamo alzare ed abbassare le serrande soltanto pronunciando “alza le serrande”, oppure spegnere tutte le luci di casa prima di andare a dormire pronunciando “spegni tutte le luci”.
Assistenti vocali e privacy
Uno dei grandi dibattiti che girano sugli assistenti vocali è il rispetto della privacy.
In effetti avere un microfono che sembra stare sempre in ascolto, connesso ad internet, può far venire un po’ di angoscia.
Ma la verità è che gli assistenti vocali non stanno sempre in funzione.
Sono si sempre in ascolto, ma le funzionalità vengono attivate solo con particolari parole.
Questo è stato spiegato in maniera molto dettagliata durante un caso di omicidio, in cui l’imputato ha chiesto i file di Amazon Alexa come prova della sua innocenza, se sapete un po’ di inglese potete leggere a questo link la storia: il caso di Adam Crespo e Amazon Alexa.
Amazon ha dovuto portare in tribunale tutti i file audio prodotti dall’Amazon Echo del suo cliente, ed ha spiegato come funziona il dispositivo.
In particolare ha spiegato che vengono inviati file audio ai server Amazon soltanto quando il proprietario pronuncia “Alexa” o “Computer” o “Amazon”.
Pare che anche Google ha un sistema che funziona con parole che attivano le registrazioni, ma ovviamente, a meno di situazioni come quella che ha obbligato Amazon a spiegare come funzionano gli assistenti vocali da lei prodotti, sono ipotesi che non hanno una risposta certa visto che c’è una buona protezione su questo tipo di brevetti.
I nostri dati sono al sicuro?
Ora che abbiamo capito come funzionano gli assistenti vocali, la domanda successiva è: che succede ai dati prodotti da questi dispositivi?
Al momento i file audio prodotti degli assistenti risiedono sui server delle rispettive aziende, che ad oggi sono molto attente alla sicurezza informatica.
Ad oggi i furti e un uso non corretto di dati personali, e non parlo solo email e password, ma anche abitudini, siti visitati e altro, hanno coinvolto più che altro i social (ricordate lo scandalo di Cambridge Analytica?), mentre le società a cui fanno capo gli assistenti vocali più utilizzati, Google Home e Amazon Echo in primis, non hanno mai avuto di questi problemi, e non abbiamo motivo per pensare che ne avranno in futuro.
Quello che però ci viene da domandare è sapere dove vanno a finire i dati prodotti delle ricerche effettuate tramite assistente vocale.
Senza andare a leggere le leggende sugli assistenti vocali che girano sui siti di fake news i problemi sui dati generati da queste domande e ricerche possono essere meno fantascientifici di quello che pensiamo.
La prima domanda che mi pongo è: come vengono trattati i comandi dati agli elettrodomestici collegati? Soprattutto se sono elettrodomestici collegati ad internet.
Ad esempio sapere quando una televisione è accesa in una determinata casa può indicare la presenza o meno dei proprietari di casa, oppure quando vengono aperte e chiuse le tapparelle o quando vengono accese e spente le luci di casa.
Finché vengono utilizzati a fini pubblicitari, tutto sommato, non è un danno così grave, il problema vero nasce quando questi dati escono dal circuito pubblicitario e finiscono in mani spregiudicate e con scopi che al momento non possiamo neanche immaginare.
Quindi, per concludere il discorso, abbiamo capito che i dati degli assistenti vocali sono ben protetti e limitati solo al comando impartito, ma possiamo dire lo stesso dei dispositivi e degli elettrodomestici collegati ad essi?