Mistral, la startup AI francese, vuole ha appena lanciato Forge, una piattaforma per creare modelli AI personalizzati addestrati sui dati dell’azienda. Non fine-tuning su un modello esistente. Addestramento da zero.
Mistral lancia Forge: modelli AI su misura per le aziende
“Personalizzazione” è la parola che si sente di più nel mercato dell’AI aziendale. Nella pratica, significa quasi sempre aggiustamenti su un modello già addestrato, senza stravolgerne la struttura, oppure al RAG, interroga i dati aziendali al momento della risposta. Funziona, fino a un certo punto. Il modello, in fondo, resta quello di partenza.
Mistral invece, permetterà alle aziende di addestrare modelli partendo da zero, usando la propria libreria di modelli open-weight come base. In teoria, questo risolve problemi che il fine-tuning solitamente non affronta. Consente una gestione migliore delle lingue diverse dall’inglese, dei dati molto specialistici e offre un controllo più completo sul comportamento del modello. Inoltre, permetterà di addestrare agenti AI con il reinforcement learning, senza dipendere da fornitori esterni.
I compromessi che si fanno quando si costruiscono modelli più piccoli è che non possono essere altrettanto bravi su ogni argomento quanto i modelli più grandi
, ha spiegato il co-fondatore Timothée Lacroix. La possibilità di personalizzarli permette di scegliere cosa enfatizzare e cosa tralasciare.
Team di ingegneri al servizio dei clienti
Forge non offre solo strumenti per creare dati sintetici e gestire l’infrastruttura. Il problema è che molte aziende non sanno come usarli davvero. Non hanno le competenze per valutare se il modello funziona bene o per capire quali dati servono e in che quantità.
Per questo Mistral AI affianca ai clienti un team di ingegneri che lavora direttamente con loro, aiutandoli a progettare i sistemi. un modello preso in prestito da IBM e Palantir. Tra i primi che stanno già usando Forge di Mistral ci sono Ericsson, l’Agenzia Spaziale Europea, la società di consulenza italiana Reply, le agenzie governative di Singapore DSO e HTX, e ASML.
I casi d’uso
I principali ambiti di utilizzo sono piuttosto diversi tra loro, ma hanno un punto in comune, la necessità di modelli capaci di adattarsi al proprio contesto.
Per esempio, i governi possono usare questi sistemi per avere modelli che capiscono davvero la lingua, le norme e i riferimenti culturali locali, invece di basarsi su soluzioni pensate soprattutto per il mondo anglosassone.
Nel settore finanziario, invece, il tema centrale è la conformità alle regole. Le banche e le istituzioni devono rispettare normative molto rigide, quindi hanno bisogno di modelli sui cui mantengono il controllo, e addestrati su dati specifici e verificati.
Nel manifatturiero, le aziende vogliono soluzioni su misura per i propri processi, macchinari e flussi di lavoro, quindi servono modelli altamente personalizzati.
Infine, le aziende tech hanno bisogno di modelli capaci di lavorare sul proprio codice, in base ai linguaggi, agli strumenti e agli standard interni.