Sora, il generatore di video AI di OpenAI, ha fatto parlare di sé fin dal suo debutto. E non è difficile capire perché. I risultati sono così realistici, da sfidare la percezione umana. O forse no. Perché la maggior parte di ciò che genera ha ancora quel “qualcosa che non va”, quei piccoli dettagli che tradiscono l’origine artificiale.
Eppure, c’è margine per migliorare. Se si vuole ottenere il meglio da Sora, bisogna imparare l’arte del prompting, ovvero di dare istruzioni precise e creative all’AI. Ecco alcuni trucchi per generare video più naturali.
Trucchi per ottenere il massimo da Sora
1. Puntare sullo stile e l’estetica, non sui dettagli
Sora non è bravissimo con i dettagli specifici. Si può descrivere minuziosamente ogni particolare di una scena, ma spesso l’AI li ignorerà o li interpreterà in modo bizzarro. Quello che invece sa cogliere molto bene è la “vibrazione” generale del prompt, lo stile e l‘atmosfera che si vogliono evocare. Ad esempio, se si chiede “Un uomo con una giacca rossa che legge un libro blu su una panchina di legno in un parco autunnale“, Sora potrebbe effettivamente generare una scena con un uomo su una panchina in un parco dall’atmosfera autunnale, ma magari la giacca sarà di un altro colore, o il libro potrebbe trasformarsi inspiegabilmente in un tablet a metà video. La panchina potrebbe avere una forma insolita, oppure essere fatta di pietra anziché di legno.
Dove invece Sora brilla è nella coerenza stilistica e nell’impatto visivo. Se gli si chiede “Un video drammatico con un cowboy solitario sotto la pioggia battente“, genererà un’inquadratura suggestiva: magari un cielo tempestoso, la luce soffusa del tramonto che si riflette sulle gocce di pioggia, il cowboy con un’aria malinconica… ma forse il cowboy potrebbe impugnare il cappello in un modo strano, o tenerlo in testa anche quando il vento lo dovrebbe far volare via. Gli oggetti di scena potrebbero cambiare tra un frame e l’altro, come la pistola che sparisce improvvisamente dalla fondina.
2. Non esagerare con la complessità
Sora ha difficoltà a gestire scene molto complesse o movimentate. Ad esempio si può chiedere un inseguimento in auto tra due supercar su una strada di montagna.
Ci si aspetterebbe di vedere due auto che sfrecciano a tutta velocità tra le curve, con gomme che stridono e una ripresa in movimento. Ma si potrebbe ottenere delle auto che sembrano ferme anche se dovrebbero essere in corsa, movimenti innaturali (es. le auto si muovono senza girare le ruote), o la strada che cambia forma o inclinazione tra un frame e l’altro.
Morale della favola? Sora funziona benissimo per creare atmosfere cinematografiche statiche o con movimenti lenti, ma con scene frenetiche o molto affollate i risultati possono diventare strani o poco credibili.
Sembra che il segreto dei video apparentemente perfetti che circolano sui social sia proprio questo: limitare al massimo il movimento e le interazioni complesse. Quindi, se desidera ottenere risultati puliti, meglio evitare di chiedere troppe azioni o dettagli in una singola scena.
Sora non è l’unico generatore video a non saper gestire bene i movimenti e le azioni complesse. Anche gli altri modelli soffrono degli stessi limiti, ecco perché molti dei video AI più virali sui social sembrano straordinari a prima vista, ma solo perché sono stati progettati con accorgimenti che evitano le situazioni più difficili da gestire.
Un esempio notevole è “Egypt 3099”, un video creato con Kling AI che ha fatto il giro del web per la sua qualità visiva e il suo stile futuristico affascinante. Tuttavia, se lo si osserva attentamente, si nota che il video è composto principalmente da scene statiche o con movimenti lenti e minimali. Questo non è un caso: chi lo ha realizzato (volontariamente o meno) ha impostato un prompt che limita le azioni complesse, sfruttando i punti di forza del generatore e nascondendo i suoi difetti.
Had a a chance to finally try out out @Kling_ai 1.6 model and have been blown away. It really picks up fine little details and brings them to life. Here's a short I made called Egypt 3099. pic.twitter.com/nb0z4gmmLu
— Isaac Rodriguez (@isaachorror) January 10, 2025
Che cosa si può dedurre quindi? Che con gli attuali generatori di video AI, il segreto non sta tanto nella complessità del prompt, ma nella sua capacità evocativa. Bisogna trovare le parole giuste per stimolare la “fantasia” dell’AI, lasciandole però un certo margine di interpretazione.
Ad esempio, un prompt come questo potrebbe essere troppo complesso: “Un guerriero cyberpunk che corre tra i vicoli di una Tokyo futuristica, schivando auto volanti, sparando con pistole laser e combattendo contro un robot con una spada di luce.”
Ma magari potrebbe funzionare meglio un prompt più evocativo del tipo: “Un guerriero cyberpunk illuminato dalle luci al neon si muove tra i vicoli di una Tokyo futuristica, con pioggia che scorre sulle sue giacche di pelle e il bagliore di una spada laser riflesso nei suoi occhi.”
3. Attenzione all’interazione tra oggetti
C’è un aspetto in particolare in cui Sora sembra ancora molto “artificiale”: l’interazione tra oggetti. Quando un soggetto deve afferrare, manipolare o usare un oggetto, spesso il risultato è strano, poco realistico o persino comico. Purtroppo Sora, ma gli altri generatori di video AI non sono da meno, fanno fatica a capire la fisica.
Ad esempio, si può chiedere a Sora di generare “Una ragazza che versa il tè in una tazza“. Ci si aspetterebbe di vedere il liquido che scende lentamente, la tazza che si riempie, magari un po’ di vapore che si alza. Cosa si ottiene invece? Il tè potrebbe non fluire correttamente, apparendo più come un blocco solido che un liquido.
La mano potrebbe attraversare la tazza o versare il tè nel vuoto. Il livello del liquido nella tazza potrebbe non aumentare in modo realistico, o potrebbe addirittura scomparire tra un frame e l’altro.
Quando entrano in gioco interazioni fisiche complesse quindi, il risultato può sembrare innaturale o artificiale. Anche in questo caso, limitando l’azione e concentrandosi sullo stile e sull’atmosfera, si può ottenere un video visivamente accattivante.
Sora in Italia
L’unica nota dolente, almeno per il nostro Paese, è che Sora non è ancora disponibile, ma è lavoro per espandere ulteriormente l’accesso nei prossimi mesi. Per aggirare l’ostacolo, basta utilizzare una VPN. Va precisato però che l’accesso al generatore al di fuori dei Paesi elencati è espressamente vietato da OpenAI e può comportare il blocco o la sospensione dell’account.
Alternative a Sora
Per chi fosse curioso di provare altri generatori di video AI, ecco un elenco di valide alternative a Sora.