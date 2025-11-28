DeepSeek che ha deciso di puntare dritto al cuore pulsante della matematica più complessa. Il genere di matematica che fa venire mal di testa anche ai professori universitari, quella fatta di teoremi, dimostrazioni rigorose e problemi che hanno tormentato generazioni di studiosi.

L’AI cinese DeepSeek ora risolve teoremi matematici complessi

L’azienda cinese, che con i suoi modelli open source ha scosso la Silicon Valley, torna alla carica con DeepSeekMath-V2. È un’intelligenza artificiale capace di dimostrare teoremi matematici con il rigore di un matematico vero.

La differenza rispetto ai modelli precedenti sta tutta nell’approccio. DeepSeekMath-V2 non si accontenta di arrivare alla risposta giusta. Vuole mostrare come ci è arrivato, passo dopo passo, con una derivazione rigorosa che possa essere verificata.

Il sistema usa quello che l’azienda chiama “ciclo di verifica generazionale“, una specie di meccanismo interno che funziona come un controllore severo. C’è un verificatore basato su un LLM addestrato specificamente per controllare le dimostrazioni dei teoremi. E poi c’è un generatore di prove che lavora usando questo verificatore come modello di ricompensa.

La cosa interessante, è che il generatore viene incentivato a identificare e risolvere i problemi nelle proprie dimostrazioni. Non è un processo statico, il modello genera, verifica, scopre dove sbaglia, corregge, e usa quelle correzioni per diventare ancora migliore. Un circolo virtuoso in cui la macchina diventa più brava proprio perché continua a correggere se stessa.

Medaglie d’oro e punteggi da paura

Le chiacchiere stanno a zero quando arrivano i risultati concreti. E DeepSeekMath-V2 ha già dimostrato di non essere solo fumo negli occhi. Ha ottenuto punteggi di livello oro alle Olimpiadi Internazionali di Matematica 2025 e alle Olimpiadi Cinesi di Matematica 2024.

Ma il risultato più interessante è quello ottenuto al Putnam 2024, una delle competizioni matematiche più spietate che esistano. DeepSeekMath-V2 ha ottenuto 118 punti su 120 usando il calcolo scalare in tempo di prova. Si tratta di un risultato mostruoso.

Verso nuove scoperte (forse)

Il modello è basato su DeepSeek-V3.2-Exp-Base ed è disponibile su HuggingFace, con tutto il supporto per l’inferenza documentato su GitHub. Perché DeepSeek, fedele alla sua filosofia, ha deciso di rendere tutto open source. E questo è fondamentale, perché significa che chiunque abbia le competenze tecniche può metterci le mani sopra, sperimentare, migliorarlo.

L’obiettivo va oltre le competizioni e i punteggi da record. DeepSeek vuole sbloccare una comprensione più profonda della matematica, quella che potrebbe portare a scoperte scientifiche in settori come l’assistenza sanitaria e la tecnologia avanzata.

Per chi volesse approfondire, il modello è documentato sulla pagina GitHub dedicata, completa di paper di ricerca scaricabile in PDF. E naturalmente, può essere scaricato direttamente da HuggingFace per chi vuole sperimentare in prima persona.