Mentre tutti parlano di modelli di intelligenza artificiale sempre più grandi e potenti, Microsoft ha scelto la strada opposta. La nuova creatura di Redmond si chiama Mu ed è un LLM compatto progettato per girare interamente sul dispositivo. Il suo primo compito? Rendere finalmente sensata la ricerca nelle Impostazioni di Windows 11.

Mu segue le orme di Phi-Silica, il primo modello linguistico piccolo che Microsoft ha integrato nei PC Copilot+ per le app di prima e terza parte. Ma mentre Phi-Silica aveva un approccio più generale, Mu è stato progettato con un obiettivo molto specifico: rendere l’interazione con le Impostazioni di Windows 11 intuitiva come una conversazione.

Mu, l’AI di Microsoft che capisce cosa vuole fare l’utente

Mu alimenta la nuova funzione agente nell’app Impostazioni, disponibile per gli utenti Windows Insider con PC Copilot+. Invece di cercare voci di menu criptiche, si può digitare “come faccio a cambiare lo sfondo” e il sistema capisce esattamente cosa si vuole fare.

Il modello funziona esclusivamente sulle unità di elaborazione neurale (NPU) dei PC Copilot+, elaborando oltre 100 token al secondo direttamente sul computer. Nessun dato inviato a server esterni, nessuna latenza di rete, nessun problema di privacy.

Con soli 330 milioni di parametri, Mu è un gigante in formato tascabile rispetto ai modelli mainstream. Microsoft ha ottenuto questo risultato utilizzando un’architettura encoder-decoder che riduce la latenza del primo token del 47% e aumenta la velocità di decodifica di 4,7 volte rispetto a modelli decoder-only di dimensioni simili.

Il trucco sta nella condivisione dei pesi tra alcuni componenti, che permette di ridurre il numero totale di parametri mantenendo le prestazioni. I test mostrano che Mu è quasi comparabile a Phi-3.5-mini, nonostante sia un decimo delle dimensioni.

Come funziona MU sui Copilot+PC

Mu eccelle con query di più parole ma funziona meno bene con input brevi o parziali. Per questo motivo, l’app Impostazioni continuerà a mostrare risultati di ricerca lessicale e semantica tradizionali quando rileva input troppo corti. Il modello è stato addestrato usando GPU NVIDIA A100 su Azure Machine Learning, ottimizzato per le impostazioni di sistema più che per le conversazioni generiche.

Gli utenti interessati possono testare l’agente AI scaricando Windows 11 Build 26120.3964 o successive dal canale Dev degli Insider.