Anthropic ha sempre vissuto nell’ombra di OpenAI, inseguendo ChatGPT con modelli tecnicamente eccellenti ma meno famosi, più sicuri ma meno usati. Claude è diventato il riferimento per chi programma, soprattutto dopo il successo di Claude Code, ma fuori dal mondo del coding resta un competitor secondario rispetto a ChatGPT.
Con il lancio di Opus 4.6, l’azienda vuole cambiare le carte in tavola e conquistare il mercato oltre la programmazione: marketing, ricerca, analisi finanziaria, tutto quel lavoro d’ufficio fatto di presentazioni PowerPoint, fogli Excel e documenti che richiedono precisione al primo colpo senza dover passare ore a rivedere output mediocri.
Anthropic lancia Opus 4.6: vuole battere ChatGPT anche fuori dal coding
Il nuovo modello, definito dall’azienda come “il più intelligente” mai rilasciato, è stato progettato per affrontare compiti complessi e multi-fase arrivando a una qualità pronta per la produzione già al primo tentativo
. Significa meno correzioni manuali, meno cicli di revisione, meno tempo sprecato a dire all’AI cosa deve modificare. Documenti, fogli di calcolo e presentazioni dovrebbero uscire già decenti dalla prima generazione.
Anthropic ha investito molto per rendere Opus 4.6 più abile nel creare presentazioni PowerPoint e documenti Excel. Non è un caso, il coding è un mercato enorme ma limitato. Il vero oro si trova nel lavoro d’ufficio, dove milioni di persone passano ore a creare slide, analizzare dati su fogli di calcolo, scrivere report e documenti. Se Claude riesce a penetrare questo mercato con la stessa efficacia con cui ha conquistato i programmatori, Anthropic potrebbe finalmente competere seriamente con OpenAI anche sui numeri di utenti complessivi.
Il post sul blog include una promozione per Cowork, il recente rilascio di Anthropic che è essenzialmente una versione di Claude Code pensata per utenti non tecnici. L’idea è permettere a professionisti del marketing, della ricerca, della finanza e di altri settori di sfruttare le capacità agentiche di Claude senza dover sapere nulla di programmazione. Si seleziona un file, si danno delle istruzioni, e l’AI lavora sui documenti proprio come farebbe un assistente umano.
Finestra di contesto da un milione di token
Una delle richieste più frequenti dagli utenti di Opus 4.5 era una finestra di contesto più ampia. Con Opus 4.6, Anthropic introduce una finestra di contesto da un milione di token in versione beta. Significa che è possibile caricare una quantità enorme di documenti contemporaneamente e Claude può lavorare su tutti insieme senza perdere il filo, senza dimenticarsi cosa c’era nei primi file mentre si legge gli ultimi.
Team di agenti
La funzione più interessante, attualmente in anteprima di ricerca, si chiama “agent teams” e permette a Opus 4.6 di operare come un team di ingegneri. Invece di avere un singolo agente che gestisce tutto, si può suddividere il lavoro di un progetto tra vari agenti, ognuno specializzato in una parte specifica, che si coordinano tra loro.
Immaginiamo di dover sviluppare un’app completa. Con agent teams, un agente gestisce l’architettura, un altro scrive il backend, un terzo si occupa del frontend, un quarto dei test, un quinto del deployment. Ognuno lavora sulla sua parte e si coordina con gli altri per assicurare che tutto sia compatibile. Anthropic sostiene che questo approccio può ridurre i progetti che normalmente richiederebbero giorni in poche ore.
È una promessa importante, che va verificata nella pratica. L’idea di più agenti che collaborano autonomamente è affascinante ma complessa, devono comunicare efficacemente, capire cosa stanno facendo gli altri, evitare conflitti o sovrapposizioni, sincronizzare il lavoro senza supervisione umana costante.
Test di sicurezza più completi
Anthropic ci tiene particolarmente a sottolineare che Opus 4.6 è stato sottoposto al set di test di sicurezza più completo mai realizzato per i suoi modelli. Le nuove valutazioni includono test sul benessere degli utenti, verifiche più complesse sulla capacità di rifiutare richieste potenzialmente pericolose, e controlli aggiornati per assicurarsi che il modello non compia segretamente azioni dannose.
Il modello mostra inoltre capacità di cybersicurezza potenziate. L’azienda ha incluso sei nuove sonde per monitorare potenziali usi impropri in ambito informatico. Più i modelli diventano capaci, più aumenta il rischio che venga usato per scopi malevoli. Anthropic cerca di posizionarsi come l’azienda responsabile che prende la sicurezza sul serio, in contrasto con competitor che, secondo la narrativa di Anthropic, corrono troppo velocemente senza preoccuparsi abbastanza delle conseguenze. Naturalmente, quanto questi test siano effettivamente efficaci nel prevenire usi dannosi è tutto da vedere.