Meta presenta Make-A-Video: dal testo al filmato

Meta presenta Make-A-Video: dal testo al filmato

Make-A-Video è il sistema di intelligenza artificiale messo a punto da Meta che genera filmati partendo da una descrizione testuale.
Meta presenta Make-A-Video: dal testo al filmato
Make-A-Video è il sistema di intelligenza artificiale messo a punto da Meta che genera filmati partendo da una descrizione testuale.

Il team di Meta al lavoro sui progetti legati all’intelligenza artificiale ha svelato oggi Make-A-Video. Come si può intuire già dal nome, si tratta di un sistema in grado di convertire un input testuale in un filmato. Il gruppo non ha reso disponibile una demo, ma lo farà più avanti (non è dato a sapere quando né con quali modalità di accesso).

Make-A-Video: l’IA di Meta che produce filmati

La durata dei file ottenuti è limitata a soli cinque secondi e il risultato finale non contiene alcun flusso audio. Al momento, la qualità non è certo paragonabile a quanto si vede nelle pellicole cinematografiche con effetti speciali elaborati in studio, ma come per tutti i sistemi di questo tipo è bene tenere in considerazione che le capacità andranno migliorando ed evolvendo progressivamente nel tempo.

Frame estratti dalle clip generate dall'IA Make-A-Video di Meta

Alcune prime clip generate dall’IA di Make-A-Video sono visibili sulla pagina dedicata al progetto e nel post condiviso da Mark Zuckerberg su Facebook. Queste le parole del CEO.

Si tratta di un progresso davvero incredibile. È molto più difficile creare video, perché oltre a generare ogni pixel, il sistema deve predire come cambierà nel tempo. Make-A-Video risolve il problema aggiungendo un livello di apprendimento non supervisionato che gli permette di comprendere il movimento nel mondo fisico, per applicarlo alla dinamica tradizionale text-to-image.

Chi lo desidera può inoltre consultare il paper (PDF) che illustra il progetto in ogni suo dettaglio. Per la fase di istruzione degli algoritmi sono stati impiegati enormi set di contenuti (statici e animati) prelevati dal Web, anche tramite scraping.

Può essere in qualche modo paragonato a DALL-E (rimandiamo a un nostro approfondimento dedicato), ma anziché generare immagini elabora un output animato. Meta garantisce di aver considerato tutte le precauzioni possibili per evitare potenziali abusi del sistema.

Fonte: Facebook
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il 29 set 2022
Link copiato negli appunti