Sembra che OpenAI sia ad un passo dal rilasciare uno strumento AI in grado di prendere il controllo del computer ed eseguire azioni per conto nostro. La notizia arriva da Tibor Blaho, un ingegnere informatico noto per le sue azzeccate anticipazioni sui prodotti AI in arrivo.
OpenAI Operator is real, and its coming in the ChatGPT macOS app.
You'll be able to set a shortcut for toggling Operator. pic.twitter.com/iFJgC4YUxg
— M1 (@M1Astra) January 19, 2025
In arrivo Operator, l’agente AI di OpenAI, indizi nascosti nel codice e sul sito
Blaho afferma di aver trovato prove dell’esistenza di Operator, il chiacchierato agente AI di OpenAI capace di gestire autonomamente compiti come scrivere codice e prenotare viaggi. Secondo lui, il client ChatGPT per macOS ha guadagnato opzioni (per ora nascoste) per definire scorciatoie per “attivare Operator” e “forzare la chiusura di Operator”.
Ma non è tutto. Blaho sostiene che sul sito di OpenAI siano apparse riferimenti a Operator, anche se non ancora visibili pubblicamente. Tra queste, ci sarebbero tabelle che confrontano le prestazioni di Operator con quelle di altri sistemi AI che usano il computer (come Claude 3.5 Sonnet).
Operator non è ancora perfetto, ma supera gli umani in alcuni compiti
Stando ai numeri trapelati, Operator non è affidabile al 100%. Su OSWorld, un benchmark che simula un ambiente informatico reale, “OpenAI Computer Use Agent (CUA)” – forse il modello AI che alimenta Operator – ottiene un punteggio del 38,1%, davanti al modello di Anthropic ma ben lontano dal 72,4% degli umani.
Operator supera le prestazioni umane su WebVoyager, che valuta la capacità di un’AI di navigare e interagire con i siti web. Ma fatica con compiti che per un uomo sarebbero una passeggiata, come creare un portafoglio Bitcoin (successo solo nel 10% dei casi).
La corsa agli agenti AI
L’imminente ingresso di OpenAI nel campo degli agenti AI arriva mentre rivali come Anthropic e Google (con Gemini Deep Research) fanno le loro mosse in questo settore nascente. Gli agenti AI possono essere rischiosi, ma a sentire loro sono già la prossima grande novità nel campo dell’intelligenza artificiale.
Secondo Markets and Markets, il mercato degli agenti AI potrebbe valere 47,1 miliardi di dollari entro il 2030. Ma alcuni esperti sollevano preoccupazioni sulla loro sicurezza, se la tecnologia dovesse migliorare rapidamente.
Uno dei grafici trapelati mostra Operator performare bene su alcune valutazioni di sicurezza, inclusi test che cercano di far eseguire al sistema “attività illecite” e di fargli cercare “dati personali sensibili”. La sicurezza sarebbe tra i motivi del lungo ciclo di sviluppo di Operator. In un recente post su X, il co-fondatore di OpenAI Wojciech Zaremba ha criticato Anthropic per aver rilasciato un agente che, a suo dire, manca di mitigazioni di sicurezza.
Ma anche OpenAI è stata criticata da ricercatori AI, inclusi ex dipendenti, per aver presumibilmente messo in secondo piano il lavoro sulla sicurezza a favore di una rapida commercializzazione della sua tecnologia. La corsa agli agenti AI è appena iniziata e si preannuncia ricca di colpi di scena.