Questi occhiali con IA possono leggere il labiale

Questi occhiali con IA possono leggere il labiale

Il ricercatore Ruidong Zhang ha costruito degli occhiali potenziati dall'intelligenza artificiale capaci di leggere il labiale.
Questi occhiali con IA possono leggere il labiale
Il ricercatore Ruidong Zhang ha costruito degli occhiali potenziati dall'intelligenza artificiale capaci di leggere il labiale.

Il laboratorio Smart Computer Interfaces for Future Interactions (SciFi) della Cornell University è riuscito nell’intento di realizzare un’intelligenza artificiale da integrare a degli occhiali per leggere il labiale. Chiamati EchoSpeech, tali occhiali diventano un’interfaccia di riconoscimento vocale silenziosa che sfrutta rilevamento acustico e IA per riconoscere fino a 31 comandi non vocali basati semplicemente sul movimento di labbra e bocca.

Anche gli occhiali ora hanno l’IA

Sviluppati da un team di ricercatori e tecnici guidati da Ruidong Zhang, autore principale dello studio “EchoSpeech: Continuous Silent Speech Recognition on Minimally-obtrusive Eyewear Powered by Acoustic Sensing”, gli occhiali in questione potrebbero rivelarsi essenziali per tutti coloro che intendono comunicare con altre persone tramite smartphone in luoghi dove parlare potrebbe essere scomodo o inappropriato. O ancora, potrebbero dare una voce a tutti coloro che non possono vocalizzare suoni.

Nella sua forma attuale, questa interfaccia può persino essere abbinata a stilo e software di progettazione come CAD, rendendo del tutto superfluo l’utilizzo di tastiera e mouse.

Occhiali EchoSpeech IA

Ma come riescono a catturare il labiale? Grazie a un paio di microfoni e altoparlanti minuscoli, gli occhiali EchoSpeech funzionano come dei sonar potenziati dall’intelligenza artificiale, capaci di catturare il movimento della bocca e le onde sonore. Il collega Cheng Zhang, assistente professore dello SciFi Lab, ha dichiarato:

“Siamo molto entusiasti di questo sistema perché fa davvero avanzare il campo in termini di prestazioni e privacy. È piccolo, a basso consumo e sensibile alla privacy, tutte caratteristiche importanti per l’implementazione di nuove tecnologie indossabili nel mondo reale.”

La tecnologia di rilevamento acustico in dotazione ad EchoSpeech, dunque, elimina la necessità di videocamere indossabili e richiede molte meno risorse per l’elaborazione di dati rispetto a strumenti analoghi che si basano su immagini o video. A beneficiarne è anche la batteria in dotazione agli occhiali, capace di durare fino a 10 ore.

Fonte: Cornell
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
7 apr 2023
Link copiato negli appunti