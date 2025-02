Martedì pomeriggio, Anthropic ha lanciato una sfida bizzarra: far giocare a Pokémon Rosso la sua ultima creatura, Claude 3.7 Sonnet. Peccato che l’AI, pur dotata di capacità di ragionamento notevoli, fatichi non poco a destreggiarsi tra Pallet Town e dintorni…

Claude 3.7 Sonnet di Anthropic si cimenta con Pokémon su Twitch, ma che fatica!

Usare i videogiochi per testare i modelli di intelligenza artificiale non è certo una novità. Da Street Fighter a Pictionary, i ricercatori si sono divertiti a sfidare le loro creature digitali nei contesti più disparati. Per Anthropic, il gioco della Nintendo si è rivelato un ottimo benchmark per valutare le capacità di ragionamento di Claude 3.7 Sonnet appena sfornato insieme a Claude Code.

A differenza del suo predecessore Claude 3.5 Sonnet, incapace persino di uscire di casa a Biancavilla, la nuova versione dell’AI è riuscita a conquistare ben tre medaglie della palestra. Un traguardo notevole, se paragonato alle performance di altri modelli come o3-mini di OpenAI e R1 di DeepSeek.

Eppure, anche per Claude 3.7 Sonnet la strada è ancora lunga e tortuosa. Dopo ore di diretta su Twitch, l’AI si è bloccata davanti a un muro di roccia, incapace di capire come aggirarlo. “Chi vincerà, un’AI con migliaia di ore di programmazione alle spalle o un misero muro di roccia?”, ha ironizzato un utente in chat.

Seguire le gesta di Claude su Pokémon Rosso è un’esperienza straniante. Da un lato, è snervante vederlo procedere con la velocità di uno Slowpoke, rimuginando su ogni singolo passo con una lentezza esasperante. Dall’altro, è impossibile non restare incollati allo schermo, affascinati dal suo processo di ragionamento che scorre in tempo reale a sinistra, mentre a destra si svolge la partita.

In un momento epico, Claude ha cercato di individuare il Professor Oak nel suo laboratorio, ma si è confuso scambiandolo per un altro personaggio. Apriti cielo nella chat di Twitch!

Nostalgia canaglia…

Per i veterani di Twitch, la diretta di Anthropic avrà avuto un sapore nostalgico. Più di dieci anni fa, milioni di persone si erano cimentate in un esperimento sociale senza precedenti: giocare tutti insieme a Pokémon Red, controllando il personaggio tramite la chat. Il risultato? Un caos glorioso e irripetibile, che aveva segnato la storia della piattaforma.

Oggi, gli “esercizi di stile” in cui le AI rivisitano quella storica impresa hanno un retrogusto dolceamaro. Se all’epoca eravamo tutti compagni di squadra, uniti nel far progredire il gioco nonostante i continui giri a vuoto del protagonista, ora siamo ridotti a semplici spettatori. Spettatori che guardano un’intelligenza artificiale arrancare in un gioco che dei bambini saprebbero padroneggiare meglio.