Ad aprile 2025, Firefox ha rilasciato 31 correzioni di bug. Ad aprile 2026, ne ha rilasciate 423. La differenza ha un nome: Mythos, il modello di cybersicurezza di Anthropic che Sam Altman ha definito “marketing basato sulla paura“ e che Anthropic ha dichiarato troppo potente per il rilascio pubblico.
I ricercatori di sicurezza di Mozilla ora raccontano cosa significa lavorare con Mythos nella pratica. La risposta: centinaia di vulnerabilità ad alta gravità scoperte, incluse alcune dormienti nel codice da oltre dieci anni.
Il salto di qualità con Mythos di Anthropic
Fino a sei mesi fa, gli strumenti AI per la ricerca di bug erano più un fastidio che un aiuto, inondavano i team di sicurezza con report di bassa qualità e falsi positivi. I ricercatori di Mozilla descrivono però un cambiamento rapidissimo: È difficile rendere l’idea di quanto la situazione sia cambiata in pochi mesi. Da una parte, i modelli sono diventati molto più capaci. Dall’altra, abbiamo migliorato radicalmente il modo in cui li utilizziamo.
La differenza, spiegano, è nei nuovi sistemi agentici, non si limitano a segnalare possibili problemi, ma verificano anche la qualità delle proprie analisi e scartano autonomamente i risultati meno affidabili.
Mythos riesce a violare la sandbox di Firefox
Il risultato più impressionante riguarda la sandbox di Firefox, la parte più sicura del browser, progettata per isolare i processi e impedire che codice malevolo raggiunga il sistema. Per trovare vulnerabilità nella sandbox, il modello deve scrivere una patch compromessa per il browser, poi attaccare la parte più sicura del software con il nuovo codice implementato. È un processo a più step, che richiede creatività e attenzione ai dettagli.
Il programma bug bounty di Mozilla paga fino a 20.000 dollari per chi trova un bug nella sandbox. Nonostante la cifra, Brian Grinstead, ingegnere di Mozilla, dice che Mythos trova più vulnerabilità sandbox di quante ne abbiano mai trovate i ricercatori umani.
Mythos trova i bug, ma non li corregge
Un dettaglio importante, Mozilla non usa l’AI per correggere i bug che trova. Il team chiede all’AI di proporre patch, ma il codice che ne risulta non può essere distribuito direttamente, serve come modello per un ingegnere umano. Per i bug di cui parliamo in questo post, ognuno ha un ingegnere che scrive la patch e uno che la rivede. Non può essere automatizzato
, dice Grinstead.
Insomma, l’AI sa dove sono i problemi, ma non sa ancora come risolverli in modo affidabile.
Un mese dopo l’anteprima di Mythos, la maggior parte dei bug scoperti probabilmente non è stata ancora corretta. Anthropic segue le norme di divulgazione responsabile, ma è probabile che malintenzionati usino tecniche simili dietro le quinte.
Come osserva Grinstead: È uno strumento utile sia per gli hacker sia per chi si occupa di difesa. Però il fatto che sia disponibile sposta l’ago della bilancia leggermente a favore della difesa. La realtà è che nessuno conosce ancora davvero la risposta.
Il punto, quindi, è che queste tecnologie possono rafforzare entrambe le parti: chi protegge i sistemi e chi cerca di violarli.