OpenAI sceglie la strategia open source per i modelli AI?

Durante una sessione AMA (Ask Me Anyhing) su Reddit, Sam Altman e alcuni dirigenti di OpenAI hanno risposto alle domande degli utenti. Uno degli argomenti trattati riguarda le modalità di rilascio dei modelli. Il CEO della startup californiana ha ipotizzato di adottare un approccio open source, come ha fatto DeepSeek con il modello R1.

OpenAI è dalla parte sbagliata della storia

DeepSeek ha stupito i diretti concorrenti con il modello R1 che offre prestazioni simili o superiori al modello o1 di OpenAI. Questo risultato sarebbe stato ottenuto utilizzando circa 2.000 GPU NVIDIA H800 e spendendo meno di 6 milioni di dollari. Secondo OpenAI, l’azienda cinese avrebbe però sfruttato i dati di output dei suoi modelli tramite la tecnica della distillazione.

Sam Altman aveva fatto i complimenti a DeepSeek. Durante la sessione AMA su Reddit ha ammesso che l’azienda cinese ha ridotto il vantaggio di OpenAI nell’intelligenza artificiale e che OpenAI è “dalla parte sbagliata della storia” per quanto riguarda l’approccio open source.

I modelli GPT-1 e GPT-2 erano open source. Il codice è disponibile su GitHub con licenza MIT. A partire da GPT-3 è stato scelto un approccio closed source (licenza proprietaria). Questa novità coincide praticamente con l’accordo sottoscritto con Microsoft. Rispondendo ad una domanda, il CEO ha dichiarato:

Personalmente penso che dobbiamo elaborare una diversa strategia open source. Non tutti in OpenAI condividono questa visione e non è nemmeno la nostra massima priorità attuale. Produrremo modelli migliori in futuro, ma manterremo un vantaggio minore rispetto agli anni precedenti.

Kevin Weil (Chief Product Officer) ha aggiunto che potrebbe essere rilasciato il codice dei vecchi modelli. Probabile anche la pubblicazione di maggiori dettagli sulla “catena di pensiero” dei modelli che usano il ragionamento, come o3-mini (accessibile gratuitamente a tutti).

Altman, Weil e alcuni ricercatori di OpenAI hanno inoltre confermato che il modello o3 sarà disponibile nelle prossime settimane. Non c’è invece una timeline per il modello GPT-5. L’azienda ha infine avviato lo sviluppo del successore di DALL-E 3.

Fonte: TechCrunch

Annulla

Stai citando questo messaggio:

NaN undefined

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech