Big Sleep è l’ultimo gioiello di Google per dare la caccia ai bug più pericolosi del web. Ma questa volta non parliamo di un team di hacker esperti che passano notti in bianco davanti al computer: è un’intelligenza artificiale.

Google scatena l’AI Big Sleep contro i bug: primi risultati sorprendenti

Big Sleep, sviluppato da DeepMind in collaborazione con il leggendario team Project Zero di Google, ha appena consegnato il suo primo rapporto: 20 vulnerabilità scoperte in software open source popolari come FFmpeg e ImageMagick. Ogni fala è stata trovata e riprodotta dall’agente AI senza alcun intervento umano. Certo, Google mantiene un esperto in carne e ossa nel ciclo per verificare la qualità dei rapporti prima di inviarli, ma la scoperta iniziale è completamente automatizzata.

Questo dimostra una nuova frontiera nella scoperta automatizzata di vulnerabilità , ha scritto Royal Hansen, vicepresidente di ingegneria di Google. E ha ragione. Mentre gli hacker umani si basano su intuizione, esperienza e spesso fortuna, Big Sleep può analizzare migliaia di righe di codice con una precisione chirurgica e senza mai stancarsi.

Il fatto che questi bug non siano ancora stati risolti significa che Google non può dire quanto siano gravi. È la regola standard, finché i problemi esistono, non si danno dettagli per evitare che qualcuno li sfrutti.

Ma il punto non sono i dettagli. Il punto è che un’AI ha trovato vulnerabilità vere nel codice vero, non in esercizi di laboratorio.

I limiti dei cacciatori di bug AI

Big Sleep non è l’unico nel campo. Strumenti come RunSybil e XBOW stanno già facendo parlare di sé. La sicurezza informatica sta iniziando a cambiare volto. Ma non tutto è oro quello che luccica. Diversi manutentori di progetti software si lamentano di ricevere segnalazioni di bug che si rivelano essere allucinazioni dell’intelligenza artificiale.