OpenAI sceglie la strategia open source per i modelli AI?

OpenAI sceglie la strategia open source per i modelli AI?

Secondo Sam Altman, OpenAI dovrebbe scegliere una strategia open source e fornire più dettagli sulla catena di pensiero dei modelli della serie o.
OpenAI sceglie la strategia open source per i modelli AI?
Secondo Sam Altman, OpenAI dovrebbe scegliere una strategia open source e fornire più dettagli sulla catena di pensiero dei modelli della serie o.

Durante una sessione AMA (Ask Me Anyhing) su Reddit, Sam Altman e alcuni dirigenti di OpenAI hanno risposto alle domande degli utenti. Uno degli argomenti trattati riguarda le modalità di rilascio dei modelli. Il CEO della startup californiana ha ipotizzato di adottare un approccio open source, come ha fatto DeepSeek con il modello R1.

OpenAI è dalla parte sbagliata della storia

DeepSeek ha stupito i diretti concorrenti con il modello R1 che offre prestazioni simili o superiori al modello o1 di OpenAI. Questo risultato sarebbe stato ottenuto utilizzando circa 2.000 GPU NVIDIA H800 e spendendo meno di 6 milioni di dollari. Secondo OpenAI, l’azienda cinese avrebbe però sfruttato i dati di output dei suoi modelli tramite la tecnica della distillazione.

Sam Altman aveva fatto i complimenti a DeepSeek. Durante la sessione AMA su Reddit ha ammesso che l’azienda cinese ha ridotto il vantaggio di OpenAI nell’intelligenza artificiale e che OpenAI è “dalla parte sbagliata della storia” per quanto riguarda l’approccio open source.

I modelli GPT-1 e GPT-2 erano open source. Il codice è disponibile su GitHub con licenza MIT. A partire da GPT-3 è stato scelto un approccio closed source (licenza proprietaria). Questa novità coincide praticamente con l’accordo sottoscritto con Microsoft. Rispondendo ad una domanda, il CEO ha dichiarato:

Personalmente penso che dobbiamo elaborare una diversa strategia open source. Non tutti in OpenAI condividono questa visione e non è nemmeno la nostra massima priorità attuale. Produrremo modelli migliori in futuro, ma manterremo un vantaggio minore rispetto agli anni precedenti.

Kevin Weil (Chief Product Officer) ha aggiunto che potrebbe essere rilasciato il codice dei vecchi modelli. Probabile anche la pubblicazione di maggiori dettagli sulla “catena di pensiero” dei modelli che usano il ragionamento, come o3-mini (accessibile gratuitamente a tutti).

Altman, Weil e alcuni ricercatori di OpenAI hanno inoltre confermato che il modello o3 sarà disponibile nelle prossime settimane. Non c’è invece una timeline per il modello GPT-5. L’azienda ha infine avviato lo sviluppo del successore di DALL-E 3.

Fonte: TechCrunch
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
2 feb 2025
Link copiato negli appunti