Due settimane dopo il lancio di Opus 4.6, il modello di punta, Anthropic aggiorna anche Sonnet, la versione intermedia della famiglia Claude. Sonnet 4.6 diventa il modello predefinito per gli utenti dei piani Free e Pro.

L’aggiornamento rispetta il ciclo quadrimestrale che Anthropic si è data e si concentra su tre aree: coding, capacità di seguire le istruzioni e uso del computer. Non sono miglioramenti scelti a caso. Rappresentano tre fronti che contano, perché è lì che si gioca la partita tra i modelli di fascia media, quelli usati dalle aziende nel lavoro di tutti i giorni, e che determinano quale servizio vale la pena tenere.

Anthropic lancia Claude Sonnet 4.6: più potente e una finestra di contesto enorme

La novità più concreta è la finestra di contesto, che in versione beta raddoppia rispetto al massimo precedente raggiungendo un milione di token. Secondo Anthropic è sufficiente a contenere interi codebase, contratti lunghi o decine di paper di ricerca in una singola richiesta. Vuol dire che, invece di spezzettare il lavoro, gli si può dare l’intero progetto in un colpo solo e chiedergli di ragionarci sopra.

Un milione di token non è una novità assoluta nel settore, Gemini offre finestre di contesto simili da tempo, ma per Sonnet, che è il modello che la maggior parte degli utenti Claude usa effettivamente, è un bel passo avanti.

I benchmark: numeri impressionanti

Sonnet 4.6 arriva con una serie di record nei benchmark. Risultati di punta su OS World per l’uso del computer e su SWE-Bench per l’ingegneria software. Ma il dato più interessante è il punteggio di 60,4% su ARC-AGI-2, un test progettato per misurare capacità specifiche dell’intelligenza umana, e che piazza Sonnet 4.6 sopra la maggior parte dei modelli.

Tuttavia, resta dietro a modelli più grandi e costosi come Opus 4.6, Gemini 3 Deep Think e una versione ottimizzata di GPT 5.2, ma era prevedibile per un modello di fascia media. Sonnet non è pensato per essere il migliore in assoluto, ma il miglior compromesso tra prestazioni e costo. E su quel terreno, i numeri parlano a suo favore.

Ora all’appello manca solo Haiku, il modello più piccolo e veloce della famiglia. Probabilmente l’aggiornamento arriverà nelle prossime settimane.