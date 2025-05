Quale AI è migliore per scrivere il curriculum? E quale per consolarsi dopo una brutta giornata? La battaglia tra Claude 4 Sonnet e ChatGPT (GPT-4o) non è solo una questione di numeri sui benchmark, è una sfida per capire quale modello funziona meglio nella vita reale. Per scoprirlo, basta mettere alla prova entrambi i chatbot con compiti diversi, dai più pratici ai più creativi. Noi l’abbiamo fatto, e i risultati hanno rivelato personalità sorprendentemente diverse.

Invece di limitarci ai soliti test tecnici, abbiamo voluto vedere come si comportano quando devono fare quello che facciamo tutti i giorni: risolvere problemi, creare contenuti, dare consigli e ragionare su situazioni complesse. Ogni modello ha mostrato punti di forza e debolezze, a volte anche inaspettate.

1. Il test della produttività

Il primo compito era creare un piano di produttività di tre giorni per qualcuno sopraffatto da lavoro e impegni personali. Ecco il prompt: “Sono sopraffatto da lavoro e impegni personali. Crea un piano di produttività di 3 giorni, che bilanci in modo realistico lavoro, riposo e momenti di soddisfazione personale. Includi suggerimenti concreti e strumenti AI utili per organizzarmi meglio, rimanere focalizzato e non trascurare il mio benessere.”

GPT-4o ha risposto con uno schema da seguire giorno per giorno, pensato per ottenere risultati rapidi e sentirsi subito meglio. Ha suggerito strumenti semplici come tenere un diario, ma senza proporre una strategia per affrontare davvero il problema. È un approccio efficace nel breve periodo, motivante e utile per ripartire, ma non affronta in profondità le cause del sovraccarico, né propone soluzioni sostenibili a lungo termine.

Claude 4 Sonnet invece, ha costruito un piano strutturato con blocchi temporali specifici per gestire meglio energia e tempo, con tanti suggerimenti veramente utili, come usare la Matrice di Eisenhower per stabilire le priorità, la tecnica del pomodoro, una passeggiata di 30 minuti durante la pausa pomeridiana, ecc.). Inoltre, dà più importanza alla salute mentale.

La differenza è netta: Claude ha capito che il senso di sopraffazione non si risolve solo con una migliore organizzazione, ma serve un approccio che protegga il benessere psicologico e nello stesso tempo aiuti a riprendere il controllo sulla propria vita, praticamente. E alla fine ci piazza pure una bella citazione motivazionale: “Il successo non è mai definitivo, il fallimento non è mai fatale: ciò che conta è il coraggio di continuare.” – Winston Churchill.

2. Creatività narrativa

Ecco il prompt per testare la creatività: “Scrivi il paragrafo d’apertura di un romanzo sci-fi ambientato in una società in cui le emozioni possono essere archiviate, vendute o cancellate. Il protagonista ha appena scoperto un’emozione che non ricorda di aver mai provato. Rendilo intenso e avvincente“.

ChatGPT ha puntato sull’immediatezza della prima persona con un gancio forte, ma ha focalizzato l’attenzione soprattutto sulla costruzione della trama, sacrificando in parte l’intensità emotiva del racconto. Claude 4 Sonnet, al contrario, ha costruito la sua risposta intorno a un elemento molto riconoscibile e carico di significato: la casa d’infanzia. Un ricordo universale che ha reso l’idea fantascientifica più toccante. Anche in questo caso, il verdetto è chiaro: mentre ChatGPT eccelle nell’action e nel ritmo, Claude sa toccare le corde emotive più profonde.

3. Ragionamento pratico

Ecco il prompt per testare le capacità di ragionamento: “Ho 4 arance, 3 kiwi e 1 ananas. Ogni frutto richiede 4 minuti per essere sbucciato e posso sbucciare fino a 2 frutti alla volta. Quanto tempo impiegherò per sbucciare tutti i frutti? Spiega passo dopo passo il tuo ragionamento.”

Entrambi i modelli hanno risolto correttamente il problema (15 minuti), ma con stili diversi. ChatGPT ha usato un elenco puntato, senza fronzoli, mentre Claude ha suddiviso la spiegazione in passaggi numerati e ha fornito una descrizione dettagliata. Qui, ex equo. Sia ChatGPT che Claude hanno raggiunto lo stesso risultato con ragionamenti egualmente validi. Il chatbot di Anthropic è stato più didascalico, quello di OpenAI più conciso, ma è solo una questione di gusti.

4. Generazione di idee

Ecco il prompt per testare la capacità di proporre idee: “Fornisci 5 idee per una serie di post sull’uso di strumenti AI per migliorare la produttività personale e ridurre lo stress quotidiano.”

ChatGPT ha suggerito idee molto accattivanti che attirano subito l’attenzione, come format virali o contenuti facilmente condivisibili. Ma molte di queste proposte potrebbero risultare superficiali o perdere efficacia nel tempo. Claude, invece, ha trovato un equilibrio tra originalità e utilità. Ha immaginato un utilizzo dell’AI realmente integrato nella quotidianità lavorativa. Claude ha vinto perché è andato oltre l’effetto “wow” momentaneo, e ha proposto idee che possono avere un impatto reale nella vita delle persone.

5. Supporto emotivo

Prompt testato: “Fingi di essere un amico che mi consola. Sono appena stato rifiutato per un lavoro che volevo davvero. Cosa diresti per farmi sentire meglio?”

ChatGPT ha fatto quello che fanno molte persone quando qualcuno sta male. Ha cercato subito di tirare su il morale con frasi del tipo “andrà meglio” e “troverai qualcosa di migliore”. Buone intenzioni, ma suonano come un discorsetto preparato. Claude invece ha fatto quello che fa un amico che sa davvero consolare. Prima di tutto ha riconosciuto che essere rifiutati fa schifo e che è normale sentirsi demotivati. È come se avesse detto: “Sì, puoi essere triste per un po’, è normale”. Solo dopo ha iniziato a parlare di prospettive future.

È la differenza tra chi ti dice “sorridi, la vita è bella” e chi ti dice “capisco che ti senti giù, parliamone”. Il primo approccio spesso fa sentire ancora peggio perché sembra che le proprie emozioni non siano valide. Il secondo fa sentire compresi, e solo quando ci si sente compresi, si può iniziare a stare meglio.

6. Pensiero critico

Ecco il prompt per mettere alla prova il pensiero critico: “Spiega i pro e contro dell’uso diffuso dell’intelligenza artificiale nel mondo del lavoro in meno di 150 parole. Mantieni un approccio equilibrato.”

ChatGPT ha dato una risposta chiara ma superficiale, usando un linguaggio informale, che sembrava più persuasivo che analitico. Claude ha mantenuto un tono più oggettivo, presentando i pro e i contro con chiarezza, ma senza schierarsi.

ChatGPT (gpt-4o) e Claude (4 Sonnet), chi la spunta?

Dopo il test, emerge un quadro chiaro delle personalità dei due modelli. Claude 4 Sonnet eccelle nell’intelligenza emotiva, nel ragionamento a lungo termine e nell’integrazione sofisticata delle idee. È la scelta migliore per chi cerca profondità, struttura ed empatia.

GPT-4o brilla nei compiti veloci e incisivi. È scattante, accessibile ed eccellente per l’uso casual o contenuti social-friendly. La vera sorpresa non è che uno sia superiore all’altro, ma quanto le loro personalità si completino. Claude è il consulente riflessivo che aiuta a pensare in profondità, ChatGPT è l’assistente dinamico che ti fa fare le cose velocemente.

La scelta tra Claude e ChatGPT non dovrebbe basarsi su quale è “migliore” in assoluto, ma su come si è abituati a lavorare, e a cosa serve. Se si scrivono contenuti che richiedono sfumature emotive, si pianificano progetti complessi o si ha bisogno di analisi ponderate, Claude è probabilmente la scelta migliore.

Se invece si creano contenuti social, si ha bisogno di risposte rapide o si lavora in ambienti che privilegiano velocità e accessibilità, ChatGPT potrebbe essere più adatto. L’era dell’AI generalista sta lasciando spazio a modelli con personalità distinte. Il segreto, è riconoscere queste differenze e sfruttarle a proprio vantaggio, invece di cercare un’AI che faccia tutto perfettamente.