Bisogna ammettere che è insolito vedere un’azienda di AI regalare uno dei suoi strumenti più potenti. In genere è l’esatto contrario, le funzionalità migliori vengono riservate ai piani a pagamento, e agli utenti gratuiti toccano gli avanzi. Anthropic ha scelto una strada diversa con Claude Sonnet 4.6, che ora è il modello predefinito per chiunque acceda alla piattaforma.

Non è un gesto di generosità fine a sé stesso, ovviamente. È una mossa strategica in un mercato dove la concorrenza si fa sempre più agguerrita. Claude Sonnet 4.6 offre prestazioni che fino a poco tempo fa erano una prerogativa dei modelli di fascia alta, quelli a pagamento. Stiamo parlando di creazione di file, connettori per servizi esterni, competenze specializzate e gestione intelligente del contesto. Un salto di qualità notevole per un servizio a costo zero.

Claude Sonnet 4.6, 5 cose da provare subito

Ecco allora cinque esperimenti che mettono alla prova le capacità più interessanti del modello.

1. Dargli in pasto un documento enorme

La maggior parte degli strumenti di intelligenza artificiale va in affanno quando il materiale da analizzare supera una certa soglia. Un rapporto di ricerca completo, un contratto lungo, un capitolo di libro, dopo una certa lunghezza, il modello inizia a perdere il filo, a dimenticare l’inizio quando arriva alla fine, a produrre riassunti deludenti che escludono proprio le parti cruciali.

Claude Sonnet 4.6 gestisce una finestra di contesto da un milione di token. In termini concreti significa che è possibile incollare un romanzo intero, una base di codice completa o mesi di appunti da riunioni e chiedere al modello di analizzare, riassumere o trovare schemi che si ripetono o contraddizioni nell’intero corpo di testo senza che perdersi lungo la strada.

2. Fargli scrivere codice anche senza avere conoscenze tecniche

Per chi scrive codice, è qui che Sonnet 4.6 dà il meglio di sé. Ma anche chi non ha mai programmato in vita sua dovrebbe partire da qui. Nei test di programmazione, gli utenti lo hanno preferito al predecessore circa il settanta per cento delle volte, e molti lo hanno scelto persino rispetto al modello di punta di Anthropic, quello che costa decisamente di più.

Ciò che lo distingue non è solo la capacità di generare codice, quello lo fanno ormai in molti. È il modo in cui gestisce la parte caotica della programmazione reale: legge il codice esistente prima di fare modifiche, evita duplicazioni inutili e non complica problemi semplici. Per chi è alle prime armi, è il percorso più rapido per automatizzare qualcosa di concreto nel giro di poche ore.

Per metterlo alla prova basta partire da qualcosa di poco impegnativo, come uno script che rinomina i file di una cartella aggiungendo la data, o che automatizza un’operazione ripetitiva settimanale. Poi si può sviluppare da lì.

3. Usarlo per navigare nelle interfacce impossibili

Sonnet 4.6 non si limita a rispondere alle domande, può interagire con ciò che accade sullo schermo. Infatti, ha ottenuto il 72,5 per cento nel test di riferimento per l’interazione con i sistemi operativi.

In pratica Claude può “vedere” un’interfaccia nel browser e usarla come farebbe una persona: clicca, digita, scorre, apre menu, compila campi. È particolarmente utile con quei software aziendali macchinosi o con i portali pubblici pieni di passaggi poco intuitivi. Non è infallibile, ma quando funziona, sembra un sogno.

4. Affidargli un problema difficile da risolvere

Uno dei miglioramenti meno pubblicizzati di Sonnet 4.6 è quello che Anthropic chiama ragionamento adattivo. Invece di procedere ogni volta alla stessa velocità, o sempre lento e metodico o sempre rapido e superficiale, il modello decide autonomamente quando un problema è abbastanza complesso da richiedere un ragionamento più profondo e articolato. Lo fa da solo, senza che dover chiedere nulla.

Può essere utile per compiti che richiedono analisi vera e non solo di riconoscere degli schemi, come valutare una decisione aziendale con variabili in conflitto, mettere alla prova un ragionamento che si deve presentare, lavorare su un problema dove la risposta ovvia potrebbe essere quella sbagliata.

Ecco il prompt da testare: Sto cercando di scegliere tra queste due opzioni [indicare le opzioni], ecco tutto quello che so: [elenco di vincoli, obiettivi, dubbi], aiutami a capire cosa mi sfugge . È in questo tipo di ragionamento che Sonnet 4.6 si distacca nettamente dai modelli precedenti.

5. Costruire qualcosa di funzionante in una sola sessione

Nei test per creare applicazioni senza istruzioni preliminari, Sonnet 4.6 ha lavorato autonomamente fino a tre o quattro volte più a lungo rispetto ai modelli precedenti, producendo app funzionanti di livello paragonabile alla serie di punta. Non bisogna essere sviluppatori per fare qualche tentativo.

Claude può costruire una pagina funzionante, uno strumento interattivo semplice o un documento formattato partendo da zero. E poiché mantiene la concentrazione sul compito più a lungo senza dovergli rispiegare cosa si vuole, è possibile arrivare a un risultato finito in una singola sessione di lavoro.

Per mettere alla prova le sue capacità, si può partire da qualcosa di pratico, come un registro per il bilancio personale, o un piccolo quiz su un argomento che si sta studiando. Basta dire a Claude cosa deve fare, che aspetto deve avere e a chi è destinato, poi lasciarlo lavorare.

Come accedere e cosa tenere a mente

Per iniziare basta andare sulla piattaforma di Anthropic, creare un account gratuito e Sonnet 4.6 sarà il modello predefinito senza dover cambiare nulla. Gli account gratuiti hanno limiti di utilizzo che si attivano nei momenti di maggiore traffico, conviene iniziare la mattina presto per avere più margine, e le richieste si azzerano dopo qualche ora. Per un uso intensivo esiste l’abbonamento a pagamento.