Un funzionario dell’amministrazione Trump ha dichiarato che il nuovo modello di DeepSeek è stato addestrato con le GPU Blackwell di NVIDIA, quindi si tratta di una violazione delle regole sulle esportazioni. L’azienda californiana ha ottenuto il permesso di vendere le GPU H200 in Cina, quindi i chip AI più avanzati sono stati ottenuti in modo illegale. Anthropic ha nuovamente evidenziato che le restrizioni possono essere aggirate.
NVIDIA Blackwell usate per addestramento e distillazione
DeepSeek dovrebbe annunciare il nuovo modello V4 nel corso della prossima settimana. Il funzionario non ha svelato come il governo statunitense ha ricevuto le informazioni o come l’azienda cinese ha ottenuto i chip, ma ha sottolineato che NVIDIA non vende le GPU Blackwell in Cina. Questi chip AI sarebbero stati utilizzati in un data center in Mongolia.
Un portavoce del Ministero degli Esteri cinese ha dichiarato che la Cina rispetta le regole sull’esportazione dei chip. Donald Trump aveva ipotizzato la vendita di una versione meno potente della GPU Blackwell, ma successivamente ha comunicato che i chip AI più avanzati devono essere riservati alle aziende statunitensi. NVIDIA ha invece ottenuto il via libera per le precedenti GPU H200 (Hopper).
Diversi esperti del settore hanno evidenziato che la fiorente attività di contrabbando delle GPU Blackwell è dovuta alla scarsità di chip locali e dalla lentezza con cui vengono approvati gli acquisti della GPU Hopper. Oltre che per l’addestramento dei nuovi modelli AI, le GPU Blackwell vengono sfruttate per la distillazione.
Questo è il nome della tecnica che permette di migliorare i modelli usando gli output di modelli più avanzati. Anthropic, che aveva fortemente criticato la decisione di vendere le GPU H200 in Cina, ha recentemente scoperto l’uso della distillazione per “rubare” le capacità di Claude, successivamente sfruttate da DeepSeek e altre due aziende cinesi. Il nuovo modello V4 sarebbe stato quindi addestrato con le GPU Blackwell tramite distillazione di Claude.