Secondo il Wall Street Journal, la decisione dell’amministrazione Trump di ordinare il ban dei modelli Claude Mythos 5 e Fable 5 è arrivata dopo una segnalazione di Amazon (principale azionista di Anthropic). I ricercatori dell’azienda di Seattle hanno scoperto un modo per aggirare le protezioni, quindi il CEO Andy Jassy ha successivamente informato i funzionari governativi. La CEO di Luta Security afferma che non è un jailbreak.
Amazon ha fatto la spia?
Al momento non ci sono conferme ufficiali, quindi si tratta di indiscrezioni. Secondo le fonti del Wall Street Journal, i ricercatori di Amazon sono riusciti ad aggirare i filtri di Claude Fable 5 e ottenere informazioni che potrebbero essere sfruttate per eseguire attacchi informatici. In pratica hanno effettuato il jailbreak del modello.
Andy Jassy (CEO di Amazon) ha contattato l’amministrazione Trump per discutere del problema. Dopo un meeting tra vari funzionari, il Dipartimento del Commercio ha deciso di imporre il divieto di accesso sulla base delle norme relative alle esportazioni. Ciò significa che governi, aziende e singoli individui stranieri (inclusi i dipendenti di Anthropic) non possono più utilizzare Claude Mythos 5 e Fable 5.
Un portavoce di Amazon ha dichiarato:
In qualità di fornitore leader di servizi cloud che serve un gran numero di clienti del settore pubblico e privato, non è raro che i governi ci chiedano consiglio su potenziali rischi per la sicurezza. Quando ciò accade, non condividiamo i dettagli di queste discussioni.
Anthropic ha rispettato l’ordine del governo bloccando l’accesso ai due modelli in tutto il mondo. Come si può leggere in questa pagina, Amazon Web Services ha revocato l’accesso tramite Bedrock. L’azienda californiana ha evidenziato che il presunto jailbreak riguarda vulnerabilità minori che possono essere scoperte anche con altri modelli disponibili al pubblico, tra cui GPT-5.5 di OpenAI.
I ricercatori di Amazon avrebbero usato Claude Fable 5 per trovare vulnerabilità in almeno quattro software. Secondo la CEO di Luta Security non è un jailbreak, ma un Defense Oriented Prompting (DOP), ovvero un prompt usato per testare l’efficacia delle protezioni.
Secondo David Sacks, ex consulente dell’amministrazione Trump per AI e criptovalute, il governo ha chiesto di correggere il problema di sicurezza, ma Anthropic non ha fatto nulla. Dopo aver concesso 90 minuti di tempo per bloccare l’accesso ai due modelli, il governo ha ordinato il ban. Secondo Semafor, la decisione sarebbe basata anche sul possibile accesso ai modelli da parte di un gruppo cinese.