DeepSeek nel mirino di Meta: 4 team per studiare il successo

DeepSeek nel mirino di Meta: 4 team per studiare il successo

Meta vuole capire i segreti del successo di DeepSeek e delle sue AI low cost: creati 4 team per analizzarne modelli e tecnologie.
DeepSeek nel mirino di Meta: 4 team per studiare il successo
Meta vuole capire i segreti del successo di DeepSeek e delle sue AI low cost: creati 4 team per analizzarne modelli e tecnologie.

DeepSeek… oramai, non si parla d’altro. In poche settimane dal lancio di R1, il suo modello AI ha spodestato ChatGPT diventando la prima app gratuita sull’App Store. E non è tutto: il suo successo ha fatto tremare i giganti della Silicon Valley, con NVIDIA che ha perso ben 400 miliardi di dollari in borsa.

Ma la vera novità è l’arrivo di Janus-Pro 7B, un generatore di immagini AI che ha surclassato DALL-E di OpenAI e Stable Diffusion in diversi test. DeepSeek sostiene di aver investito meno di 6 milioni di dollari per addestrare il suo modello, contro gli oltre 100 milioni di dollari di OpenAI per ChatGPT.

Meta vuole capire i segreti del successo di DeepSeek

La popolarità di DeepSeek ha attirato l’attenzione di Meta. Così, Mark Zuckerberg ha radunato quattro squadre speciali di ingegneri, ribattezzate “war room”, per capire come diavolo abbia fatto questa startup a raggiungere prestazioni pari o superiori a quelle dei concorrenti come ChatGPT, a una frazione del costo.

Cosa faranno di preciso queste “war room“? Due team studieranno come DeepSeek sia riuscita a tagliare i costi dei suoi modelli R1, sperando di replicare la strategia per il modello Llama di Meta. Un altro team indagherà sui dati usati per l’addestramento. E l’ultimo? Cercherà di ridisegnare Llama per tener testa alla tecnologia cinese.

Allarme rosso per Llama 4

La cosa è seria, perché il capo dell’infrastruttura AI di Meta ha avvertito i colleghi che il nuovo modello di DeepSeek potrebbe surclassare anche il prossimo modello Llama, in arrivo nel 2025. Perfino Sam Altman di OpenAI si è complimentato per l’ascesa “impressionante” di DeepSeek. E NVIDIA, che ci ha rimesso un bel po’ di soldi, ha dovuto ammettere che le sue GPU sono state usate per il software della startup cinese. Insomma, DeepSeek promette di dare filo da torcere ai big del settore…

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
28 gen 2025
Link copiato negli appunti