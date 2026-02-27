I modelli AI di Anthropic sono molto utilizzati per individuare le vulnerabilità nei software. Il recente Claude Opus 4.6 è uno dei migliori in assoluto per questo tipo di attività. È disponibile anche un agente AI specializzato. La startup israeliana Gambit Security ha scoperto che il chatbot dell’azienda californiana è stato sfruttato per effettuare attacchi contro il governo messicano.

Ricerca di vulnerabilità e furto di dati con Claude

Un cybercriminale di nazionalità ignota ha effettuato attacchi contro varie agenzie governative del Messico a partire da dicembre e per circa un mese. Per ingannare Claude e aggirare le protezioni ha scritto prompt in spagnolo affinché il chatbot agisse come un hacker d’élite. Claude ha individuato almeno 20 vulnerabilità nelle reti, scritto il codice del malware e suggerito come automatizzare il furto di dati.

In seguito all’intrusione nei sistemi governativi, il cybercriminale ha rubato circa 150 GB di dati, tra cui documenti relativi a 195 milioni di registri fiscali, registri elettorali, credenziali di dipendenti pubblici e fascicoli di stato civile.

I ricercatori affermano che Claude aveva inizialmente bloccato le richieste, ma il cybercriminale ha effettuato il “jailbreak” del modello AI che ha quindi eseguito migliaia di comandi. Per aggirare le restrizioni è stato usato un trucco piuttosto semplice. Il cybercriminale ha fatto credere al chatbot di essere un “hacker white hat” che cercava vulnerabilità da segnalare ai diretti interessati.

Quando Claude si è rifiutato di rispondere, il cybercriminale ha fornito una guida dettagliata su come procedere. Anthropic ha chiuso tutti gli account utilizzati durante gli attacchi. L’azienda californiana ha inoltre comunicato che il nuovo modello Claude Opus 4.6 non può essere ingannato in questo modo.

Il cybercriminale ha tentato di usare anche ChatGPT per ottenere altre informazioni, ma le richieste sono state bloccate dalle protezioni implementate da OpenAI.