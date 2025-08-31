Lo sviluppo era stato avviato oltre un anno fa. Microsoft AI, la divisione guidata da Mustafa Suleyman (co-fondatore di DeepMind e Inflection AI), ha svelato i primi due modelli di grandi dimensioni della serie MAI (acronimo di Microsoft AI, ovviamente). L’azienda di Redmond aveva finora sviluppato solo modelli di piccole dimensioni, come quelli integrati in Windows 11 24H2.

MAI-Voice-1 e MAI-1-preview

I primi modelli sviluppati dalla divisione Microsoft AI sono MAI-Voice-1 e MAI-1-preview. Come si deduce dal nome, MAI-Voice-1 è un modello text-to-speech che consente di generare una voce naturale a partire da una descrizione testuale. Può essere generato un minuto di audio in meno di un secondo su una singola GPU. Offre quindi prestazioni elevate e consumi ridotti.

MAI-Voice-1 viene già utilizzato per le funzionalità Copilot Daily e Podcasts. Gli utenti possono testare gratuitamente il modello attraverso le Espressioni Audio in Copilot Labs. È sufficiente digitare la descrizione e scegliere modalità, voce e stile. Sono disponibili alcuni esempi.

MAI-1-preview è invece un tradizionale LLM (Large Language Model). È stato addestrato con circa 15.000 GPU NVIDIA H100. Può rispondere alle domande degli utenti in forma testuale. Non è quindi un modello multimodale. Sarà disponibile in Copilot nelle prossime settimane. Al momento è accessibile in anteprima (test pubblico) su LMArena o tramite API.

Il debutto dei nuovi modelli sembra indicare un possibile “divorzio” con OpenAI, i cui modelli alimentano Copilot. Tra le due aziende sono in corso discussioni sulle modifiche contrattuali da introdurre in vista della trasformazione di OpenAI in società a scopo di lucro. Suleyman spera che la collaborazione duri ancora per molti anni.

Microsoft AI ha già una roadmap per i prossimi cinque anni. Le future versioni dei modelli verranno addestrate su server con le GPU GB200 di NVIDIA (architettura Blackwell).