Per anni, i video generati dall’intelligenza artificiale hanno vissuto in un mondo orizzontale. 16:9, il formato classico del cinema e della TV. Del resto i modelli sono stati addestrati su film e serie televisive.

Solo che il mondo è cambiato. La maggior parte dei video che la gente guarda oggi sono verticali. TikTok, Short di YouTube, Reel di Instagram, il formato 9:16, perfetto per lo smartphone, oramai domina incontrastato.

Veo 3.1 trasforma le immagini in video verticali perfetti per TikTok

E Google si adegua. Veo 3.1, il generatore di video AI dell’azienda, ora supporta nativamente il formato verticale. Non genera in orizzontale e poi ritaglia, ma crea video pensati per essere verticali fin dall’inizio. E insieme al formato verticale arrivano una serie di altri miglioramenti che rendono Veo molto più utile per chi vuole effettivamente creare contenuti.

Lo strumento Ingredients to Video permette di generare video partendo da un massimo di tre immagini di riferimento. Invece di descrivere a parole un personaggio con capelli rossi, giacca verde, in un bosco nebbioso , si caricano tre immagini. Una del personaggio. Una del bosco. Una della giacca. E Veo estrae elementi da tutte e tre per creare il video.

Il vantaggio è il controllo. Descrivere cose a parole funziona, ma l’AI interpreta. Capelli rossi potrebbero diventare arancione chiaro o bordeaux scuro. Giacca verde potrebbe essere militare o smeraldo. Con le immagini di riferimento, si mostra esattamente cosa si vuole. Google promette che l’aggiornamento renderà i video più espressivi e creativi con dialoghi e narrazioni più ricchi.

La coerenza che mancava

Il miglioramento più importante riguarda la coerenza. Veo 3.1 dovrebbe assicurare che un personaggio mantenga lo stesso aspetto in clip diverse e ambienti diversi.

Questo è fondamentale se si vuole creare qualcosa di più lungo di cinque secondi. Fino ad ora, generare una sequenza di clip con lo stesso personaggio era una lotteria. Si poteva descrivere donna con capelli neri e occhiali tre volte, ottenere tre versioni completamente diverse della stessa persona.

Ora, teoricamente, è possibile riutilizzare personaggi, oggetti, sfondi tra scene diverse. Perciò si potrebbe effettivamente costruire una narrazione invece di clip casuali che sembrano vagamente correlate.

Risoluzione 4K

Veo 3.1 ora permette la risoluzione fino a 4K. Non è il 4K nativo che Google aveva promesso nel 2024, quello non si è ancora visto nelle versioni pubbliche, ma è comunque un passo avanti rispetto al limite precedente di 1080p.

In pratica, Veo genera il video a una risoluzione più bassa, poi usa l’AI per “migliorarlo” a 4K. Non è la stessa cosa di generare direttamente in 4K , ma per molti usi pratici è abbastanza. Google dice anche che la generazione standard a 1080p è stata migliorata per offrire video più nitidi e puliti. Che probabilmente significa meno artefatti strani, meno momenti surreali dove le mani hanno sei dita o le persone si fondono con lo sfondo.

L’integrazione nell’app Gemini e YouTube

A partire da oggi, queste funzioni vengono integrate nell’app Gemini. Perciò è possibile generare video verticali, usare immagini di riferimento e la risoluzione in 4K, tutto dall’app che già si usa per chattare con l’AI.

Ma la cosa più interessante è l’integrazione diretta su Short di YouTube e YouTube Create. Google sta posizionando Veo come strumento di creazione dei contenuti per la sua piattaforma video. Si vuole fare uno Short? Basta usare Veo per generare clip, montare su Create, e pubblicare direttamente su Short. Tutto nell’ecosistema YouTube, e tutto ottimizzato per il formato verticale.

È chiaro dove Google vuole andare a parare: rendere la generazione video AI una parte naturale del flusso creativo su YouTube invece che uno strumento separato che si usa altrove.