OpenAI sostiene che GPT-5.2 sia il suo modello più intelligente e capace mai realizzato. Ragionamento su documenti lunghi, generazione di codice complesso, scrittura professionale, analisi di immagini. Le solite promesse di marketing che abbiamo sentito cento volte. Ma è davvero così?
8 prompt difficili per testare le abilità di GPT-5.2
Ecco come si comporta GPT-5.2 messo alla prova su pianificazione, programmazione, gestione budget, comprensione visiva e pensiero critico approfondito.
1. Pianificazione complessa con ragionamento multi-livello
Il prompt: Pianifica un viaggio di tre settimane in Giappone per una famiglia di quattro persone con bambini. Includi cultura, natura, attività adatte ai bambini, alloggi, trasporti e costi stimati.
Non è una richiesta banale. Richiede di bilanciare esigenze multiple, considerare vincoli pratici, stimare costi realistici e organizzare tutto in un itinerario sensato.
GPT-5.2 restituisce un itinerario incredibilmente dettagliato. Non una lista generica di destinazioni turistiche, ma un piano completo con suggerimenti specifici sui pass ferroviari da città a città; Ryokan (alberghi tradizionali giapponesi) adatti alle famiglie; musei e attrazioni pensati per bambini; gite di un giorno con alternative in caso di maltempo; ripartizione chiara dei costi in yen ed euro; feste locali durante le date del viaggio; giorni di riposo programmati per gestire la stanchezza del viaggio.
La differenza rispetto alle risposte ottenute con modelli precedenti è evidente. Questa è una pianificazione come Dio comanda, non una lista di posti famosi copiata da una guida turistica.
2. Analisi approfondita di documenti lunghi
Il prompt: Analizza questo documento accademico e identifica i tre punti principali, includendo strategie pratiche per i prossimi passi.
Basta fornire un documento scientifico corposo su qualsiasi argomento. Pagine e pagine dense di terminologia tecnica, dati statistici e riferimenti incrociati.
ChatGPT-5.2 fornisce correttamente i tre punti principali richiesti, ma non si ferma lì. Include le citazioni da pagine specifiche per supportare ogni punto e una domanda di follow-up per sapere se si è interessati a un riassunto o a una spiegazione semplificata per i non addetti ai lavori.
Questo tipo di prompt mette in evidenza la memoria impressionante del modello, la capacità di cogliere sfumature e potenziali rischi, e l’abilità di sintetizzare informazioni complesse mantenendo un buon livello di accuratezza.
3. Generazione e debug di codice funzionante
Il prompt: Crea uno script Python per estrarre dati meteorologici, memorizzarli in SQLite e visualizzare l’andamento delle temperature.
La generazione di codice è uno di quegli ambiti dove le promesse dell’intelligenza artificiale spesso si scontrano con la realtà frustrante di script che non funzionano.
In meno di un minuto, GPT-5.2 produce codice completamente funzionante e pronto per l’uso, che include la gestione della limitazione di velocità dell’API, la formattazione corretta delle date, la gestione degli errori, le istruzioni dettagliate sulla configurazione dell’ambiente e i commenti chiari nel codice.
4. Creazione di fogli di calcolo complessi
Il prompt: Crea un modello di foglio di calcolo per la gestione del bilancio personale, con sezioni separate per entrate, spese fisse e variabili. Includi formule automatiche per il calcolo del saldo mensile, del tasso di risparmio e del totale delle spese per categoria. Aggiungi riepiloghi mensili.
I fogli di calcolo sono un terreno tradizionalmente favorevole per Gemini. Ma GPT-5.2 si è difeso più che bene. Restituisce una struttura completa di foglio di calcolo con categorie etichettate e organizzate logicamente; formule nidificate complesse (come SOMMA.SE e funzioni concatenate); grafici dinamici che si aggiornano automaticamente; pannello di riepilogo mensile; spiegazioni su come personalizzarlo per Paese e valuta.
Questo tipo di output permette praticamente a chiunque di gestire le proprie finanze in modo strutturato.
5. Risoluzione di problemi finanziari in più step
Il prompt: Ho cinquantamila euro. Consiglia una strategia di investimento a rischio moderato con motivazione dettagliata.
Per chi ha cinquantamila euro da investire, GPT-5.2 potrebbe spiegare cosa farne in modo sensato. Il modello può illustrare le attuali tendenze di mercato; delineare profili di rischio per diverse asset class; costruire un portafoglio diversificato con ETF, obbligazioni, ecc.; fornire percentuali di allocazione precise con tanto di motivazioni; spiegare la logica dietro ogni scelta.
Ovviamente ChatGPT non potrà mai sostituire un vero professionista umano, e non dovrebbe, ma il ragionamento passo dopo passo è impressionante.
6. Progettazione di presentazioni professionali
Il prompt: Progetta una presentazione di dieci slide per investitori di una startup che si occupa di sprechi alimentari basata sull’intelligenza artificiale.
Gemini crea ottime presentazioni, ma anche GPT-5.2 è capace di strutturare una presentazione in modo perfetto. L’unica pecca è che non non assembla direttamente le slide né produce un file visivo pronto all’uso. Deludente, considerando che Gemini lo fa automaticamente. Quindi, anche se il contenuto è di livello professionale, l’esperienza non è completa. Bisogna comunque usare un altro strumento per il design finale.
7. Comprensione visiva e pianificazione pratica
Il prompt: Ecco una foto della mia cantina disordinata. Suggerisci un piano di organizzazione con soluzioni per conservare gli oggetti, una stima dei costi e passaggi da seguire.”
Questo test valuta quanto bene l’intelligenza artificiale può analizzare immagini reali e fornire consigli pratici basati su quello che vede.
Dopo aver caricato l’immagine, GPT-5.2 può identificare correttamente le zone problematiche (peluche ammassati, scatoloni vuoti, attrezzature sportive messe qua e là); consigliare soluzioni specifiche cp,e scaffali impilabili, ganci a muro, contenitori trasparenti etichettati; stimare i costi con prezzi attuali di negozi reali; fornire un piano passo-passo per l’organizzazione; e suggerire un ordine logico di lavoro per massimizzare l’efficienza. Il modello non si limita a descrivere cosa vede, ma capisce il problema e propone soluzioni concrete.
8. Scrittura di documentazione tecnica in diversi linguaggi di programmazione
Il prompt: Scrivi la documentazione API per un nuovo endpoint di pagamento con esempi in tre linguaggi di programmazione.
La documentazione tecnica è difficile da scrivere bene. Deve essere precisa, chiara, completa e accessibile a sviluppatori con diversi livelli di esperienza.
GPT-5.2 è in grado di produrre documenti di livello professionale che includono autenticazione e autorizzazione; payload di richiesta e risposta con tutti i campi spiegati; gestione degli errori con codici e messaggi; limiti di velocità e best practice; esempi di codice sintatticamente corretti in Python, JavaScript e Ruby.
Non solo la qualità della scrittura è eccellente, ma la rapidità con cui il modello completa il lavoro è impressionante. Quello che normalmente richiederebbe ore di lavoro a uno sviluppatore esperto viene fatto in meno di un minuto.
Cosa significa tutto questo?
GPT-5.2 è più veloce, più intelligente e ragiona in modo molto più simile a un essere umano rispetto ai modelli precedenti. Pianifica come se capisse davvero l’obiettivo da raggiungere, affronta problemi complessi con una logica che si può seguire, spiega le cose con chiarezza anche senza bisogno di competenze avanzate.
La memoria a lungo termine, il pensiero strutturato e il tono professionale segnano un salto netto rispetto a GPT-4 e GPT-5.1.
Come dimostra il test della presentazione, non è ancora perfetto e non riesce a completare ogni compito assegnato. Inoltre, i consigli finanziari o legali richiedono sempre la verifica umana, la comprensione delle immagini è migliorata ma ha ancora dei limiti, non può sostituire l’expertise specializzata in campi complessi, e alcune risposte hanno bisogno di essere affinate.
Per i professionisti, creatori e chiunque usi l’AI sul serio, questo è il salto di qualità atteso da tempo.