Runway ha appena lanciato Gen-4.5, il suo ultimo generatore di video AI, e le promesse sono tanto audaci quanto inquietanti. “Accuratezza fisica e precisione visiva senza precedenti“, recita l’annuncio. Liquidi che si comportano come nella realtà e oggetti che non si muovono più in modo “finto”. I risultati sono così realistici, che è sempre più difficile capire se quello che si sta guardando è vero o generato da un algoritmo.
Runway lancia Gen-4.5 per generare video AI incredibilmente realistici
La grande scommessa di Gen-4.5 è sulla fisica. Non è più solo questione di generare immagini che sembrano credibili a prima vista. Il peso degli oggetti si percepisce; se un oggetto viene lanciato, continua il suo movimento in modo naturale prima di fermarsi, e se viene colpito reagisce proprio come nella realtà. Perché è facile ingannare l’occhio umano con un frame statico ben fatto, molto più difficile farlo con un video dove gli oggetti devono comportarsi come si comporterebbero nel mondo reale.
Runway sostiene che il suo nuovo modello gestisce tutto questo meglio dei predecessori, ed è più efficace nell’aderire ai prompt complessi. Quindi è possibile descrivere scene elaborate senza che il modello collassi producendo porcherie incomprensibili.
Ma c’è un “ma”. Come ammette Runway stessa, il modello ha ancora problemi con la permanenza degli oggetti e il ragionamento causa-effetto. Cioè, a volte le cose scompaiono e riappaiono dal nulla, e a volte gli effetti precedono le cause. Tipo una porta che si apre prima che qualcuno tocchi la maniglia. Piccoli dettagli che ci ricordano che, per quanto impressionante, si sta ancora guardando qualcosa generato da una macchina che non capisce veramente la realtà.
Stili multipli
Gen-4.5 non si limita al fotorealismo. Il modello gestisce meglio anche diversi stili visivi cinematografici. Ad esempio, si può chiedere di generare un video che sembra girato da Wes Anderson o uno che sembra un documentario BBC, e dovrebbe riuscire a mantenere quello stile per tutta la durata della clip.
Runway sta distribuendo Gen-4.5 gradualmente a tutti gli utenti. Chiunque potrà generare video fotorealistici con un prompt di testo.
Runway insegue Sora di OpenAI
Runway non è sola in questa corsa verso il fotorealismo, deve fare i conti con Sora di OpenAI, che promette grandi cose sulla fisica. Del resto, la posta in gioco è enorme. Dominare il mercato della generazione video AI non è cosa da poco, visto che è un settore che potrebbe rivoluzionare cinema, pubblicità, content creation, e probabilmente anche il modo in cui consumiamo notizie e informazioni.
Certo, per gli utenti il problema di non saper più cosa è reale resta, e sarà sempre peggio. Come faremo a fidarci di quello che vediamo? Come faremo a sapere se un video di un politico che dice qualcosa di controverso è autentico o generato dall’AI?