Cosa accade a quanto pronunciamo affidandoci a un assistente virtuale per la ricerca di contenuti o l’esecuzione di comandi? Dove vengono salvati i file audio catturati dai microfoni di smartphone, tablet, smart speaker e smart display? Chi li ascolta? La nostra privacy è a rischio? Domande lecite, considerando la diffusione sempre più capillare di questi dispositivi.

Assistenti virtuali e orecchie umane

I principali player nel mercato degli assistenti virtuali sono Google, Amazon (con Alexa) e Apple (con Siri). I primi due già permettono agli utenti di consultare la cronologia delle registrazioni, cancellandole se lo si desidera, anche attraverso un semplice comando vocale. La mela morsicata ancora non lo consente, ma rassicura gli utenti iOS che il trattamento viene effettuato con modalità rispettose. Un nuovo report condiviso dalla testata belga VRT fa emergere come a volte gli audio trasmessi ai server cloud delle piattaforme possano finire nelle mani, o meglio nelle orecchie, di terze parti.

In questo caso il focus è sull’Assistente Google. Il giornalista Tim Verheyden è entrato in possesso di circa 1.000 clip catturate dai device in questione e inviate da bigG a una realtà esterna che si occupa di trascriverle. Lo scopo è quello di impiegare il testo così generato per il miglioramento degli algoritmi che gestiscono l’intelligenza artificiale. Il problema è che talvolta contengono informazioni riservate, di natura privata, persino relative allo stato di salute: per la raccolta e l’elaborazione di dati di questo tipo il GDPR prevede che sia fatta esplicita richiesta al diretto interessato. Di seguito il filmato completo (si consiglia l’attivazione dei sottotitoli in inglese).

File audio, trascrizioni e algoritmi

L’azienda con la quale si è interfacciato Verheyden afferma di trascrivere ogni settimana circa un migliaio di file audio in lingua fiamminga provenienti dai server del gruppo di Mountain View, indicando se è da attribuire a un uomo, a una donna o a un bambino. Alcuni di questi sono frutto di registrazioni avvenute per errore: chi ha un dispositivo con Assistente Google sa che talvolta la wake word (“Ok Google” oppure “Hey Google”) viene talvolta riconosciuta in modo erroneo, magari perché qualcuno in TV, in radio o nella stanza pronuncia qualcosa dal suono somigliante. Viene così dato il via all’acquisizione di tutto quanto accade nell’ambiente.

Sebbene le clip siano fornite alla società esterna in forma anonima, spesso includono informazioni personali. Uno dei dipendenti interpellati afferma di aver ascoltato una donna in stato di agitazione, presumibilmente vittima di una qualche forma di violenza. In altre viene chiesta la ricerca di contenuti pornografici, altri ancora trattano questioni affettive o problemi di salute. In questi casi, stando alla sua dichiarazione, non ci sono linee guida ben definite da seguire.

La posizione di Google

Interpellata sulla questione, bigG ha affermato di aver avviato un’indagine poiché così facendo l’azienda partner ha violato le policy legate alla sicurezza dei dati, confermando in ogni caso che è solita avvalersi di “esperti di lingue nel mondo” per la trascrizione dei file catturati dall’assistente. Un processo che interessa circa lo 0,2% di tutte le registrazioni. Espressa inoltre l’intenzione di migliorare la trasparenza verso gli utenti a proposito delle modalità con le quali i comandi vocali vengono catturati, salvati e gestiti.