VASA-1 di Microsoft, l'AI che anima le foto facendole "parlare"

Qualcuno potrà anche pensare che l’intelligenza artificiale sarà presto in grado di sostituire gli esseri umani, ma ha ancora molta strada da fare su un punto: ricreare le espressioni umane senza cadere nella cosiddetta “Uncanny Valley” o Valle Perturbante.

La sfida di ricreare le espressioni umane

Come promemoria, l’affascinante teoria della “Uncanny Valley” è stata proposta nel 1970 dall’ingegnere giapponese Masahiro Mori: più una macchina diventa simile a un essere umano, più la nostra reazione emotiva diventa positiva, fino a quando non sorge un senso di straniamento e repulsione perché ci accorgiamo che non è veramente umana.

L’AI di Microsoft sembra confermare la teoria della Uncanny Valley. VASA-1, infatti, è in grado di animare le foto e farle parlare in modo estremamente realistico, ma piccole imperfezioni tradiscono la sua natura artificiale (e artificiosa) generando un po’ di inquietudine. Tuttavia, è innegabile che l’AI abbia fatto dei progressi sorprendenti nella creazione di deepfake, così tanto realistici da ingannare anche i più attenti.

Un altro esempio eclatante dei progressi dell’intelligenza artificiale è rappresentato dai presentatori AI di notiziari, praticamente indistinguibili da veri giornalisti in carne e ossa.

VASA-1: l’AI che anima i ritratti e li fa parlare

I numerosi video dimostrativi di VASA-1 mostrano una perfetta sincronizzazione labiale e espressioni facciali sorprendenti, riprodotte quasi alla perfezione. Tuttavia, nonostante l’incredibile realismo, alcuni dettagli rivelano la sua natura artificiale. Soprattutto i movimenti della testa appaiono innaturali, come se ci fosse uno stabilizzatore d’immagine; con i capelli lunghi è ancora più evidente. Anche certe espressioni non sono convincenti.

Per il resto è impressionante: VASA-1 gestisce varie lingue, anima foto, illustrazioni e dipinti… come la Monna Lisa, che si lancia in un rap sfrenato. Esilarante.

Microsoft prudente: niente demo pubblica per evitare abusi

Nonostante le sue potenzialità, il team di Microsoft è consapevole che VASA-1 potrebbe essere utilizzato in modo improprio, ad esempio per creare contenuti fuorvianti o ingannevoli. Pertanto, i ricercatori hanno deciso di non rilasciare una demo online, un’API o un prodotto fino a quando non saranno certi che la tecnologia sarà utilizzata in modo responsabile e in conformità con le normative appropriate.

L’intelligenza artificiale sta facendo passi da gigante nel ricreare le espressioni umane, ma la strada è ancora lunga. Inoltre, sarà fondamentale garantire che sistemi di questo tipo siano utilizzati in modo etico e responsabile, per evitare possibili abusi e inganni.

Annulla

Stai citando questo messaggio:

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech