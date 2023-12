Micosoft ha presentato il suo nuovo SLM open-source, Phi-2, sul suo blog ufficiale mercoledì. Phi-2 è un modello con 2,7 miliardi di parametri. L’azienda ha dichiarato che incorpora conoscenze scientifiche e set di dati esclusivi di Microsoft. È stato addestrato per circa due settimane utilizzando 96 unità di elaborazione grafica (GPU) NVIDIA A100.

Come hanno spiegato i ricercatori, Phi-2 non è stato sottoposto all’apprendimento per rinforzo come ChatGPT di OpenAI. Nonostante ciò, i test dimostrano che è meno incline alle allucinazioni e ai pregiudizi rispetto al suo predecessore, Phi-1.5, e a Lama 2 di Meta.

Cos’è l’apprendimento per rinforzo

L’apprendimento per rinforzo è una tecnica di apprendimento automatico che permette a un agente di imparare a compiere azioni ottimali in un ambiente, basandosi sulle ricompense che riceve. L’agente non ha a disposizione una guida o delle istruzioni su come comportarsi, ma deve sperimentare diverse azioni e osservare le conseguenze.

L’obiettivo dell’agente è quello di massimizzare la somma delle ricompense nel lungo periodo, trovando una strategia che gli consenta di adattarsi alle situazioni che incontra. L’apprendimento per rinforzo si ispira al modo in cui gli esseri viventi apprendono dai propri errori e dai propri successi. Alcuni esempi di applicazione dell’apprendimento per rinforzo sono i giochi, la guida autonoma, il trading e la robotica.

Il confronto con i modelli open-source di terze parti

Microsoft ha confrontato Phi-2 con modelli open-source di terze parti in diverse categorie, tra cui ragionamento, etica, comprensione del linguaggio, matematica e codifica.

In media, Phi-2 supera il modello Mistral da 700 milioni di parametri e le versioni da 700 milioni, 1,3 miliardi e 7 miliardi di parametri di Lama 2 di Meta.

Microsoft sta anche confrontando Phi-2 con Gemini Nano 2, recentemente presentato da Google. Come Phi 2, Gemini Nano 2 è progettato specificamente per i dispositivi mobili. Nei test, Phi-2 ha ottenuto risultati simili o migliori di Gemini Nano 2.

Verso l’uso dell’intelligenza artificiale in modalità locale

“In futuro, la ricerca sui sistemi di intelligenza artificiale potrà essere facilmente condotta su un normale laptop o smartphone“, ha dichiarato Microsoft, “e Phi-2 apre la strada all’era degli Small Language Model (SLM)“.

Per ora il Phi-2 è disponibile solo per scopi di ricerca. Non è disponibile per uso commerciale. “Poiché Phi-2 è un modello open source, lo apriremo solo per scopi non commerciali, non monetizzati e di ricerca“, ha dichiarato l’azienda.