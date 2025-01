Mistral AI ha pubblicato un post sul blog per annunciare il lancio di Small 3, un modello open source ottimizzato per la latenza. Con i suoi 24 miliardi di parametri, questo nuovo modello viene presentato come competitivo rispetto ad altri LLM come Llama 3.3 70B di Meta e Qwen 2.5 32B di Alibaba.

Mistral sfida DeepSeek con Small 3, più leggero e performante

La start-up francese non aveva intenzione di farsi superare sul mercato open source da DeepSeek. Small 3 è molto efficace nonostante le sue dimensioni ridotte. Infatti, si comporta molto bene in diverse aree e – se si crede ai test presentati da Mistral – è spesso superiore ad altri modelli di piccole dimensioni come Gemma 2, Qwen 2.5 e GPT-4o-mini.

Uno dei principali punti di forza di Mistral Small 3 è la sua capacità di funzionare localmente su macchine relativamente standard, come un PC con una scheda grafica Nvidia RTX 4090 o un Mac Book con 32 GB di RAM. Mistral consiglia di utilizzare Small 3 in scenari in cui sono essenziali risposte rapide e precise.

Uno strumento per competere con DeepSeek

Mistral sembra concentrarsi soprattutto sulla velocità, l’efficienza e il basso consumo di risorse, piuttosto che sulla semplice ricerca di prestazioni. In quest’ottica, Small 3 punta ad affermarsi come alternativa europea ai chatbot americani e cinesi dominanti nel settore dell’IA generativa. Mistral è pienamente impegnata in questa ambizione.

Secondo l’azienda “Mistral Small 3 è complementare ai grandi modelli di ragionamento open source, come le recenti versioni di DeepSeek, e può servire come solido modello di base per le capacità di ragionamento emergenti”. La start-up francese ha inoltre annunciato che nelle prossime settimane verranno rilasciati nuovi modelli Mistral “piccoli e grandi” con capacità di ragionamento migliorate.