ChatGPT Atlas, primi aggiornamenti per il browser di OpenAI

ChatGPT Atlas: rischi di prompt injection

Un dirigente di OpenAI ha ammesso che ChatGPT Atlas non è immune agli attacchi di prompt injection, ma alcune misure dovrebbero ridurre i rischi.
ChatGPT Atlas: rischi di prompt injection
Un dirigente di OpenAI ha ammesso che ChatGPT Atlas non è immune agli attacchi di prompt injection, ma alcune misure dovrebbero ridurre i rischi.

Un membro del team che sviluppa ChatGPT Atlas ha pubblicato su X un elenco di miglioramenti e novità che arriveranno nelle prossime settimane. Nessuna di esse riguarda la sicurezza. Dane Stuckey (Chief Information Security Officer di OpenAI) ha confermato che, come altri browser AI, ChatGPT Atlas non è immune agli attacchi di prompt injection.

Soluzioni per mitigare gli attacchi

ChatGPT Plus può eseguire diverse azioni per conto dell’utente. È quindi un tool molto potente e allo stesso tempo intrinsecamente “pericoloso”. OpenAI ha implementato varie misure di sicurezza (non può ad esempio eseguire codice, scaricare file o installare estensioni e non può accedere ad altre app o al file system), ma il browser non è perfetto. Può quindi commettere errori, come cercare di acquistare il prodotto sbagliato o dimenticare di contattare l’utente prima di eseguire un’azione importante.

Come tutti i browser AI, ChatGPT Atlas non è immune agli attacchi di prompt injection. Potrebbe quindi eseguire istruzioni nascoste in siti web, email o altre fonti che portare a risultati indesiderati, come la divulgazione di dati privati. Il CISO di OpenAI ammette che il prompt injection è un problema di sicurezza non ancora risolto e i cybercriminali investono tempo e risorse per aggirare le protezioni.

Per mitigare i rischi sono state adottate varie misure. Una di esse è denominata “logged out mode“. L’agente ChatGPT eseguirà le azioni per conto dell’utente senza accedere alle credenziali. La funzionalità “logged in mode” deve essere utilizzata solo su siti noti.

Quando l’agente AI opera su siti sensibili, Watch Mode avvisa l’utente e la scheda del browser in cui vengono eseguite le azioni deve essere sempre visibile. Se l’utente cambia scheda, l’agente si ferma. Dai primi test effettuati dallo sviluppatore Simon Willinson (inventore del termine prompt injection) sembra che non funzioni molto bene, in quanto l’agente continua ad eseguire azione in background.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
23 ott 2025
Link copiato negli appunti