Non sempre le rivoluzioni arrivano con i fuochi d’artificio. A volte si presentano sottoforma di piccoli miglioramenti, come quelli che Anthropic ha appena introdotto con Claude Opus 4.1.
Anthropic lancia Claude Opus 4.1: migliore nel coding e nel ragionamento
Nel coding Claude Opus 4.1 raggiunge il 74,5% di accuratezza su SWE-bench Verified, mentre nella programmazione sale dal 39,2% al 43,3%. Nel ragionamento matematico passa dal 75,5% al 78%. Sono piccoli miglioramenti, che nella pratica si traducono in meno errori, meno tempo perso a correggere codice sbagliato, e soprattutto meno frustrazione quando il programma non compila.
Opus 4.1 sostituisce automaticamente Opus 4, il che significa che si può passare al nuovo modello senza cambiare una riga di codice o pagare un centesimo in più. Il modello è già disponibile su tutte le piattaforme principali: API Anthropic, Amazon Bedrock, Google Cloud Vertex AI e, soprattutto, GitHub Copilot per i piani Enterprise e Pro+.
Claude Opus 4.1 integrato in Copilot di GitHub
GitHub non ha perso tempo, Opus 4.1 è già integrato in Copilot e disponibile su GitHub.com, Visual Studio Code e GitHub Mobile. Ma c’è un dettaglio importante: funziona solo in “ask mode”. Vuol dire che si dovrà interagire attivamente con l’AI invece di farla lavorare in background.
Il vero punto di forza sono i miglioramenti notevoli nel refactoring multi-file. Consiste nel riorganizzare o riscrivere porzioni di codice che si trovano distribuite su più file all’interno di un progetto, ed è una delle attività più complesse e noiose nella vita di un programmatore.
Anthropic non si nasconde dietro false modestie: ammette che i miglioramenti di Opus 4.1 sono “marginali”. Ma ha anche annunciato che nelle prossime settimane arriveranno miglioramenti sostanzialmente più grandi
ai suoi modelli AI.
Opus 4 verrà deprecato tra 15 giorni. Dopo aver rappresentato per mesi il modello più avanzato nel coding AI, cede il passo alla versione migliore di sé.