DeepSeek aggiorna il modello R1, nel coding è impressionante

DeepSeek aggiorna il modello R1, nel coding è impressionante

La versione aggiornata di R1 di DeepSeek mostra progressi nel ragionamento e nella scrittura di codice. Con risposte più lente ma accurate.
DeepSeek aggiorna il modello R1, nel coding è impressionante
La versione aggiornata di R1 di DeepSeek mostra progressi nel ragionamento e nella scrittura di codice. Con risposte più lente ma accurate.

DeepSeek ha rilasciato un po’ in sordina una versione aggiornata del suo modello R1, chiamata R1-0528. L’azienda cinese ha annunciato l’aggiornamento con un messaggio su WeChat.

R1 di DeepSeek con nuove capacità di ragionamento

Il nuovo modello è già disponibile sulla piattaforma Hugging Face con licenza MIT, che ne permette l’uso commerciale. Con i suoi 685 miliardi di parametri, il modello rimane estremamente pesante e difficile da far girare su hardware consumer standard. Ma la nuova versione ha una marcia in più, e a dirlo sono gli utenti che l’hanno testata. Il ragionamento è diventato più strutturato, con processi di pensiero che ricordano quelli di Gemini di Google per profondità e accuratezza.

Anche le capacità di scrittura hanno fatto un salto di qualità, con output più naturali e meglio formattati. Il modello ora adotta uno stile più riflessivo e ponderato, dedicando più tempo all’elaborazione delle risposte per garantire maggiore precisione.

Prestazioni migliori nella programmazione

I developer che hanno provato R1-0528 hanno notato notevoli miglioramenti nelle capacità di coding. Il modello produce codice più coerente e pulito, con alcuni utenti che lo paragonano alle prestazioni di Claude 3.7. Il modello è già apparso nelle classifiche LiveCodeBench, dove si posiziona subito dopo i modelli o4 mini e o3 di OpenAI nella generazione di codice. Super anche Grok 3 mini di Elon Musk e Qwen 3 di Alibaba negli stessi test.

L’aggiornamento comporta tempi di risposta più lunghi rispetto alla versione precedente. Il modello dedica più tempo ai “processi di pensiero”, elaborando le richieste in modo più approfondito prima di fornire una risposta. Per molti utenti questo rallentamento è un compromesso accettabile per ottenere risultati più accurati. La qualità dell’output sembra compensare ampiamente l’attesa.

R2 di DeepSeek, quando arriva?

DeepSeek aveva pianificato il rilascio di R2 a maggio. Il modello dovrebbe rappresentare un aggiornamento più sostanziale rispetto all’attuale R1-0528, ma al momento non si vede nulla all’orizzonte.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
29 mag 2025
Link copiato negli appunti