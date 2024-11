DeepSeek, una società di ricerca sull’AI cinese, ha presentato un’anteprima di DeepSeek-R1, un modello AI “ragionante”. L’azienda sostiene che può competere con o1 di OpenAI.

La cosa “strana” è che DeepSeek è sostenuta da High-Flyer Capital Management, un hedge fund quantitativo cinese che utilizza l’intelligenza artificiale per prendere le proprie decisioni di trading. Ma c’è di più. High-Flyer mira a raggiungere l’AI “superintelligente” attraverso la sua organizzazione DeepSeek e costruisce i propri cluster di server per l’addestramento dei modelli, il più recente dei quali avrebbe 10.000 GPU Nvidia A100 e sarebbe costato 1 miliardo di yen (~138 milioni di dollari).

A differenza della maggior parte dei sistemi AI, i modelli che “ragionano” si auto-verificano, dedicando più tempo a considerare una domanda o una query. Questo li aiuta a evitare alcuni degli errori in cui i modelli normalmente incappano.

