Sora, il generatore di video AI di OpenAI che sembrava rivoluzionario solo pochi mesi fa, sta perdendo terreno contro i concorrenti sempre più agguerriti. Google con Veo 3, Runway, Kling 2, e persino startup minori stanno superando quello che una volta era considerato il meglio del meglio. Ma ora spuntano indizi che suggeriscono una doppia sorpresa: GPT-5 potrebbe arrivare accompagnato da Sora 2.

OpenAI si prepara al lancio di Sora 2 per competere con Veo 3 di Google

Tibor Blaho, noto per le sue previsioni AI accurate, ha scovato qualcosa di interessante frugando nei file di OpenAI.org: nomi di host che contengono chiaramente “Sora 2“. Non è una conferma ufficiale, ma è il tipo di leak che di solito anticipa annunci importanti. Se OpenAI sta davvero preparando una nuova versione di Sora, la tempistica con GPT-5 sarebbe perfetta.

Intanto, la versione attuale di Sora ha un rapporto complicato con i movimenti umani. I video mostrano persone che si “sciolgono” l’una nell’altra, braccia che spariscono nel nulla, corpi che attraversano il terreno come fantasmi. È il limite fondamentale dei modelli AI addestrati sui video senza comprendere le leggi fisiche che li governano.

Un surfista che cavalca un’onda può sembrare realistico in teoria, ma se l’AI non capisce come gli esseri umani interagiscono con l’acqua, il risultato finale sarà sempre innaturale. È la differenza tra imitare e comprendere, e finora Sora si è fermata all’imitazione.

Uno dei vantaggi più evidenti di Veo 3 è la generazione simultanea di audio e video. Mentre Sora produce clip mute che richiedono post-produzione separata, Google offre un’esperienza completa fin dal primo output. Sora 2 potrebbe essere l’occasione per integrare finalmente questa capacità, rendendo i video immediatamente più utilizzabili.

Attualmente, la maggior parte dei generatori video AI produce clip tra i 4 e gli 8 secondi. È un limite tecnico comprensibile, ma per chi vuole creare contenuti più elaborati non è il massimo. OpenAI potrebbe puntare proprio qui per differenziarsi. Video più lunghi richiedono enormemente più potenza computazionale e energia, quindi probabilmente sarebbero riservati ai piani più costosi. Ma anche solo arrivare a 15-20 secondi cambierebbe completamente le possibilità creative della piattaforma. Anche a livello visivo, dovrebbe introdurre la risoluzione 4K.

Il problema di questi miglioramenti è che spesso si escludono a vicenda. Video più lunghi richiedono più risorse, qualità superiore pure, movimenti complessi idem. OpenAI dovrà probabilmente offrire diverse modalità: qualità massima per clip brevi, durata maggiore a risoluzione standard, movimenti complessi con limitazioni di tempo.

La strategia del doppio lancio

Abbinare Sora 2 a GPT-5 sarebbe una mossa di marketing brillante. Mentre l’attenzione mediatica si concentrerebbe sul nuovo modello linguistico, OpenAI potrebbe recuperare silenziosamente terreno sui video senza ammettere pubblicamente di essere rimasta indietro. È anche un modo per giustificare aumenti di prezzo. Invece di pagare solo per GPT-5, gli utenti riceverebbero un pacchetto completo di AI testuale e video nuova di zecca.