Anthropic ha annunciato Claude Opus 4.6 che offre molte capacità avanzate, tra cui un team di agenti AI che operano in parallelo per risolvere problemi complessi. Il nuovo modello AI ha trovato oltre 500 vulnerabilità zero-day in librerie open source. Può quindi aiutare gli sviluppatori nel loro lavoro quotidiano, contribuendo alla riduzione dei pericoli per gli utenti.
Claude Opus 4.6 è un eccellente bug hunter
I ricercatori di sicurezza utilizzano da anni specifici tool per automatizzare l’analisi del codice e individuare eventuali vulnerabilità. Una delle tecniche più note si chiama fuzzing. Vengono inseriti dati di input nel software e verificati i risultati. Invece Claude Opus 4.6 legge e ragiona come un ricercatore umano, esamina i fix del passato per trovare bug simili che non sono stati risolti e comprende quale input causa problemi.
Grazie al modello Opus 4.6, Anthropic ha individuato oltre 500 vulnerabilità zero-day in progetti open source. Questi progetti sono molto utilizzati anche in ambito enterprise e spesso diventano un bersaglio dei cybercriminali perché sono gestiti da un piccolo team di sviluppatori che non hanno le risorse per trovare e correggere i bug in tempi brevi.
Le vulnerabilità rilevate dal Opus 4.6 sono tutte corruzioni di memoria, in quanto facili da validare (il software va in crash). Le relative patch sono state però scritte dai ricercatori umani di Anthropic. Molti progetti sono stati già aggiornati. L’azienda californiana ha spiegato come il modello AI ha trovato tre vulnerabilità zero-day in GhostScript (utility che elabora file PostScript e PDF), OpenSC (utility che elabora dati di smart card) e CGIF (libreria che elabora file GIF).
Per la ricerca delle vulnerabilità è stata usata una macchina virtuale con accesso ai progetti. Claude è stato “alimentato” con utility tradizionali (ad esempio coreutils e Python) e tool di analisi (ad esempio debugger e fuzzer), ma non sono state fornite istruzioni specifiche su come utilizzare questi strumenti. Il modello AI ha identificato i bug solo sfruttando le sue capacità di ragionamento.