OpenAI ha appena rilasciato quello che definisce il suo modello più capace di sempre. Si chiama o3-pro ed è la versione migliorata di o3. L’AI, invece di dare risposte immediate, si ferma a ragionare step by step come farebbe un essere umano davanti a un problema complesso.
Nei benchmark di settore, o3-pro sta sfoggiando i suoi “muscoli”. Su AIME 2024, che testa le competenze matematiche, batte Gemini 2.5 Pro di Google. Su GPQA Diamond, un test di conoscenze scientifiche a livello di dottorato, supera addirittura Claude 4 Opus di Anthropic.
OpenAI o3-pro: nuovo modello AI che ragiona, batte Gemini e Claude
A differenza dei modelli tradizionali che generano risposte al volo, o3-pro appartiene alla categoria dei modelli che ragionano. Questo significa che affronta i problemi scomponendoli in passaggi logici, proprio come si farebbe davanti a un’equazione di fisica o un algoritmo di programmazione. Questo approccio lo rende molto più affidabile in campi che richiedono precisione, come matematica, scienze, coding. Invece di tirare a indovinare sulla base di pattern appresi, o3-pro costruisce un percorso verso la soluzione.
Ma O3-pro non è solo un chatbot. Ha accesso a una serie di strumenti che lo rendono utile per lavori concreti. Può navigare sul web, analizzare file, interpretare immagini, eseguire codice Python e persino personalizzare le risposte usando la memoria delle conversazioni precedenti.
OpenAI afferma che, nei test effettuati da esperti, o3-pro è stato preferito al modello precedente in tutte le aree valutate. In particolare, ha ottenuto i risultati migliori in ambiti come scienze, educazione, programmazione, business e supporto alla scrittura. Secondo gli esperti, o3-pro è superiore per chiarezza, completezza, capacità di seguire istruzioni e accuratezza. Sono esattamente le qualità che servono quando l’AI deve gestire compiti complessi.
Disponibilità
o3-pro è disponibile per gli utenti ChatGPT Pro e Team, e va a sostituire il precedente o1-pro. Gli utenti Enterprise ed Education dovranno aspettare una settimana in più. Il modello è anche accessibile tramite le API di OpenAI per gli sviluppatori. Il prezzo è di 20 dollari per milione di token in input e 80 dollari per milione di token in output. Per dare un’idea, un milione di token in input equivale a circa 750.000 parole, più di “Guerra e Pace”.
I limiti di o3-pro
La potenza però, ha un prezzo in termini di velocità. o3-pro impiega più tempo di o1-pro per completare le risposte. Inoltre, le chat temporanee, almeno per ora, sono disabilitate, il modello non può generare immagini, e Canvas (l’ambiente di lavoro AI di OpenAI) non è ancora supportato.