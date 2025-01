Secondo David Sacks, scelto da Trump come consulente per criptovalute e intelligenza artificiale, DeepSeek avrebbe usato i dati di OpenAI per addestrare il modello R1. L’azienda californiana ha comunicato di aver trovato le prove sull’uso della tecnica nota come “distillazione”.

DeepSeek ruba i dati di OpenAI

DeepSeek ha sviluppato il modello R1 con circa 2.000 GPU NVIDIA H800, spendendo meno di 6 milioni di dollari. Le sue prestazioni sono simili o superiori a quelle del modello o1 di OpenAI. La startup cinese ha ricevuto i complimenti da NVIDIA, Sam Altman (CEO di OpenAI) e Satya Nadella (CEO di Microsoft), ma nelle ultime ore sono emersi dubbi sul modo in cui è stato raggiunto il risultato finale.

Bloomberg aveva scritto stamattina che OpenAI e Microsoft hanno avviato indagini su quanto ipotizzato da David Sacks. I ricercatori di sicurezza dell’azienda di Redmond sospettano che DeepSeek abbia usato diversi account sviluppatore per esfiltrare i dati di OpenAI tramite API.

L’azienda guidata da Sam Altman ha dichiarato al Financial Times di aver trovato le prove. DeepSeek avrebbe sfruttato la tecnica della distillazione per addestrare il suo modello R1 con i dati di output dei modelli di OpenAI. Questa pratica è vietata dai termini del servizio.

Un portavoce di OpenAI ha dichiarato:

Sappiamo che le aziende cinesi cercano costantemente di distillare i modelli delle principali aziende di intelligenza artificiale statunitensi. Utilizziamo contromisure per proteggere la nostra proprietà intellettuale e stiamo lavorando a stretto contatto con il governo degli Stati Uniti per proteggere al meglio i modelli più capaci dai tentativi di avversari e concorrenti di accedere alla tecnologia statunitense.

Ironicamente, OpenAI è stata spesso accusata di utilizzare i dati pubblici su Internet senza consenso (è in corso uno scontro legale con il New York Times). Gli utenti dovrebbe invece prestare attenzione alla privacy perché molte informazioni raccolte da DeepSeek sono inviate a server in Cina. Il Garante italiano ha chiesto informazioni alla startup cinese.