Google ha fatto il colpaccio con Gemini Nano Banana, un modello di generazione immagini che è diventato virale e ha messo OpenAI sotto pressione. La risposta di Sam Altman e compagnia non si è fatta attendere: il nuovo ChatGPT Images, che promette editing più preciso, testi più leggibili nelle immagini e prestazioni fino a 4 volte più veloci.
Il nuovo ChatGPT Images è più preciso e veloce
A marzo, OpenAI aveva fatto centro con un aggiornamento che aveva portato milioni di nuovi utenti su ChatGPT. In una sola settimana, 700 milioni di immagini generate.
Poi a settembre è arrivato il colpo di scena. Google ha lanciato Gemini Nano Banana, un nome in codice che suona come una varietà esotica di frutta tropicale, ma che è in realtà un modello di generazione immagini impressionante. Virale nel giro di pochi giorni, Nano Banana ha superato gpt-image-1 sia nella creazione che nell’editing delle immagini, conquistando sviluppatori in tutto il mondo.
Il mese scorso, Google ha raddoppiato la posta con Gemini 3 Pro, nome in codice Nano Banana Pro. Questo modello sfrutta il ragionamento avanzato di Gemini e la conoscenza del mondo reale per produrre immagini ancora più accurate.
OpenAI non poteva restare a guardare. E così oggi arriva il nuovo ChatGPT Images, la risposta di Altman al dominio della banana.
Cosa c’è di nuovo?
Il nuovo modello promette editing più preciso e una migliore resa di loghi e volti. Una delle critiche più comuni ai modelli precedenti era proprio questa, si cambia qualcosa e improvvisamente il logo si distorce o il volto diventa irriconoscibile. OpenAI dice di aver risolto il problema.
Il nuovo ChatGPT Images segue anche meglio le istruzioni e i prompt degli utenti. Quindi, se si chiede un gatto viola con gli occhiali da sole su uno skateboard, si dovrebbe ottenere esattamente quello, non un gatto rosa senza occhiali che cammina per strada.
Altra miglioria importante: il rendering del testo nelle immagini generate. I modelli AI hanno sempre lottato con il testo, soprattutto quando diventa denso o piccolo. OpenAI sostiene di aver fatto progressi significativi.
Per gli sviluppatori, costa il 20% in meno
Gli sviluppatori possono festeggiare, il nuovo modello costa il 20% in meno per input e output di immagini rispetto a gpt-image-1. E come prima, possono controllare i costi usando il parametro di qualità. OpenAI sostiene che ChatGPT Images offre prestazioni elevate anche quando la qualità è impostata su bassa, vuol dire che si può risparmiare senza sacrificare troppo il risultato.
Per i consumatori, 4 volte più veloce
Per chi usa ChatGPT senza pensare troppo ai costi API, il nuovo modello alimenta l’esperienza di generazione di immagini su tutte le piattaforme. OpenAI ha sottolineato che è in grado di apportare modifiche accurate mantenendo intatti dettagli come illuminazione, composizione e aspetto delle persone.
E soprattutto, è fino a 4 volte più veloce del modello precedente. Meno attesa tra il prompt e l’immagine finale, un fattore critico quando si sta sperimentando e si vuole vedere subito il risultato.
OpenAI sta anche introducendo un nuovo hub dedicato alle immagini in ChatGPT, disponibile nell’app mobile e su chatgpt.com. Gli utenti possono iniziare rapidamente a generare immagini usando una serie di filtri e prompt preimpostati. I preset saranno aggiornati regolarmente per riflettere le tendenze emergenti. Lo scopo è rendere la generazione di immagini più accessibile anche a chi non ha idea di come scrivere un prompt efficace.