Anthropic ripristina Fable 5 e annuncia Sonnet 5

Anthropic ripristina Fable 5 e annuncia Sonnet 5

Anthropic ha rilasciato nuovamente Claude Fable 5 dopo aver implementato nuove protezioni che dovrebbero bloccare il 99% dei prompt pericolosi.
Anthropic ripristina Fable 5 e annuncia Sonnet 5
Anthropic ha rilasciato nuovamente Claude Fable 5 dopo aver implementato nuove protezioni che dovrebbero bloccare il 99% dei prompt pericolosi.

Anthropic ha comunicato che Claude Fable 5 è nuovamente disponibile, in quanto il Dipartimento del Commercio degli Stati Uniti ha revocato il ban imposto il 12 giugno. L’azienda californiana ha inoltre ripristinato l’accesso a Claude Mythos 5 per un gruppo limitato di organizzazioni statunitensi, dopo l’approvazione ricevuta il 26 giugno. Contemporaneamente è stato annunciato Claude Sonnet 5.

Nuove protezioni di sicurezza

A partire da oggi, Claude Fable 5 è disponibile per tutti gli utenti tramite Claude Platform, Claude.ai, Claude Code e Claude Cowork. Nei prossimi giorni sarà accessibile anche tramite AWS, Google Cloud e Microsoft Foundry. Gli abbonati Pro, Max, Team e Enterprise sarà incluso fino al 50% dei limiti di utilizzo settimanali, ma dal 7 luglio serviranno i crediti. Anthropic ha pubblicato una cronologia degli eventi e descritto le nuove protezioni di sicurezza.

I due modelli sono stati rilasciato il 9 giugno. Fable 5 ha maggiori protezioni per uso generale, mentre Mythos 5 è solo disponibile a pochi partner tramite Project Glasswing. Il governo statunitense ha imposto il ban dopo aver ricevuto una segnalazione da Amazon. Fable 5 aveva trovato vulnerabilità software e dimostrato come potevano essere sfruttate. Anthropic ha verificato che le stesse vulnerabilità possono essere trovate da modelli meno potenti, tra cui Opus 4.8 e GPT-5.5. Nonostante ciò ha aggiornato le protezioni, quindi la tecnica usata dai ricercatori di Amazon viene bloccata nel 99% dei casi.

L’azienda californiana sottolinea che Fable 5 non ha capacità cyber offensive, come Mythos 5, ma solo difensive. Quando l’utente inserisce determinati prompt, i classificatori rilevano il potenziale pericolo e impediscono al modello di rispondere (il prompt verrà girato a Claude Opus 4.8). I ricercatori di Amazon sono riusciti ad ingannare i classificatori (jailbreak) e ottenere le risposte. Anthropic ha ora aggiornato i classificatori, incrementando il “margine di sicurezza”. Ciò comporta però un aumento dei falsi positivi.

L’azienda ha evidenziato che oggi non esiste uno standard comune per determinare la gravità di un jailbreak. Per questo motivo collaborerà con Amazon, Google, Microsoft e altri partner per definire i criteri. Anthropic rispetterà l’ordine esecutivo di Trump, quindi rilascerà i futuri modelli dopo il controllo preliminare delle capacità cyber e fornirà i dettagli sulle protezioni che verranno implementate per bloccare eventuali jailbreak.

Anthropic ha annunciato anche la disponibilità di Claude Sonnet 5. Il nuovo modello offre prestazioni simili a quelle di Opus 4.8, ma a prezzi inferiori. Tutti i dettagli sono disponibili in un articolo dedicato.

Fonte: Anthropic
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
1 lug 2026
Link copiato negli appunti