Per anni Microsoft ha pagato OpenAI miliardi di dollari per usare i suoi modelli AI come se fossero suoi. DALL-E per le immagini, GPT per il testo. Ma evidentemente a Redmond si sono fatti due conti… Il risultato è MAI-Image-1, il primo generatore di immagini AI sviluppato internamente da Microsoft, ora disponibile su Bing Image Creator e su Copilot Audio Expressions.
Annunciato a ottobre, il modello segna un momento importante nella strategia AI di Microsoft: meno dipendenza da OpenAI, più controllo diretto sulla tecnologia. Certo, l’Unione Europea dovrà aspettare ancora un po’ perché Mustafa Suleyman, responsabile dell’intelligenza artificiale di Microsoft, ha detto che il modello sarà “presto disponibile” nell’UE. Forse tra qualche settimana o qualche mese.
Cosa si può fare con il generatore AI di immagini MAI-Image-1 di Microsoft?
Secondo Suleyman, il modello eccelle nella generazione di immagini di cibo e scene naturali, oltre che nell’illuminazione artistica e nei dettagli fotorealistici. In pratica, le cose che qualunque generatore di immagini AI degno di questo nome dovrebbe saper fare.
Ma Microsoft si sbilancia un po’ di più sul blog aziendale, dove spiega che MAI-Image-1 è particolarmente bravo a creare immagini fotorealistiche, soprattutto quando ci sono illuminazioni complesse, riflessi e giochi di luce. E, soprattutto, è più veloce di molti modelli più grandi e lenti.
MAI-Image-1 verrà usato anche per creare le immagini che accompagnano le storie audio generate dall’AI nella modalità storia di Copilot Audio Expressions, il sistema di sintesi vocale di Copilot. Quindi un’AI scrive una storia, un’altra AI la legge con voce sintetica, e una terza AI crea le illustrazioni. Un sogno per chi autoproduce contenuti.
Microsoft sempre più indipendente da OpenAI
È sempre più evidente che Microsoft voglia svincolarsi dalla dipendenza dai modelli di OpenAI. Ad agosto l’azienda aveva già annunciato i suoi primi modelli interni, MAI-Voice-1 per la voce e MAI-1-preview per il testo. All’epoca Microsoft aveva detto che avrebbe usato MAI-1-preview in Copilot in alcuni casi non specificati.
Ma Microsoft non sta abbandonando completamente OpenAI. Anzi. Il chatbot Copilot sta passando all’ultimo modello di OpenAI, GPT-5, e offre anche i modelli Claude di Anthropic come alternativa. Di solito, diversificare funziona.
Sul sito e sull’app di Bing per la creazione di immagini, MAI-Image-1 è elencato come uno dei tre modelli disponibili. Gli altri due, DALL-E 3 e GPT-4o, sono entrambi di OpenAI. Quindi tecnicamente Microsoft ora offre sia la propria tecnologia che quella del partner/concorrente.
Bisogna ammettere, che la relazione tra Microsoft e OpenAI è una delle più strane nel mondo tech. Microsoft ha investito miliardi in OpenAI, ne possiede una fetta importante, e usa i suoi modelli su praticamente tutti i prodotti AI. Ma allo stesso tempo sta costruendo i propri modelli per ridurre la dipendenza.
Dal punto di vista di Microsoft, ha senso. Non si può basare tutta la propria strategia AI sulla tecnologia di qualcun altro, nonostante i soldi investiti. Un piano B è d’obbligo. Dal punto di vista di OpenAI, probabilmente non sono entusiasti di vedere il loro principale investitore diventare anche un concorrente. Ma d’altra parte, prendono ancora i soldi di Microsoft, quindi finché dura…
L’Europa aspetta… come sempre
Il fatto che MAI-Image-1 non sia ancora disponibile nell’UE non sorprende nessuno. Ogni volta che una big tech lancia qualcosa che riguarda l’AI, l’Europa deve aspettare. A volte per ragioni di regolamentazione, l’AI Act e altre normative UE richiedono compliance specifiche. A volte semplicemente perché le aziende americane lanciano prima sul mercato domestico e poi si espandono.
Suleyman ha detto che sarà presto disponibile
nell’UE, ma non ha fornito una data precisa. Nel frattempo, gli utenti europei che vogliono usare i generatori di immagini AI hanno comunque DALL-E 3 e GPT-4o disponibili su Bing, quindi non è che restino proprio a bocca asciutta.