StableLM è il nuovo modello di linguaggio open source che sfida GPT

StableLM è il nuovo modello di linguaggio open source che sfida GPT

Stability AI ha svelato StableLM, nuovo modello di linguaggio open source che punta lo sguardo a GPT e sfida apertamente OpenAI.
StableLM è il nuovo modello di linguaggio open source che sfida GPT
Stability AI ha svelato StableLM, nuovo modello di linguaggio open source che punta lo sguardo a GPT e sfida apertamente OpenAI.

In seguito all’annuncio di Stable Diffusion XL, nuova IA generativa di Stability AI semrpe più capace di creare deepfake realistici, la stessa organizzazione rilascia il modello di linguaggio open source StableLM. Perfezionandola grazie alla collaborazione degli sviluppatori di tutto il mondo, tale soluzione potrebbe diventare l’alternativa open source a ChatGPT per eccellenza.

Cos’è StableLM?

StableLM viene proposta attualmente in una versione Alpha su GitHub con modelli di dimensioni di 3 miliardi e 7 miliardi di parametri, con licenza Creative Commons BY-SA-4.0 e capacità simili a GPT-3 pur con molti meno parametri. Stability AI dichiara che questo modello di linguaggio genera testo prevedendo le parole, esattamente come GPT-4, a partire dal prompt inviato dall’utente, scrivendo programmi e testi con uno stile simile a quello umano.

Secondo l’azienda londinese, StableLM è stato addestrato su “un nuovo set di dati sperimentali” basato sul pacchetto open source chiamato The Pile, ma tre volte più grande e, pertanto, capace di garantire “prestazioni sorprendentemente elevate” al modello in questione.

OpenAI GPT Logo

 

Come ripreso da Ars Technica, al momento StableLM risulta funzionare meglio rispetto al modello LLaMA di Meta, ma non appare ancora al livello di GPT-3. Considerato però che Stability AI intende rilasciare dei modelli con 15 e 65 miliardi di parametri, tali iterazioni potrebbero riuscire nell’intento di sfidare GPT-3.

Per ora, la società si limita a dichiarare quanto segue:

“I modelli linguistici costituiranno la spina dorsale della nostra economia digitale e vogliamo che tutti abbiano voce in capitolo nel loro design. Modelli come StableLM dimostrano il nostro impegno per una tecnologia AI che sia trasparente, accessibile e di supporto. […] I nostri modelli StableLM possono generare testo e codice e alimenteranno una gamma di applicazioni a valle. Dimostrano come modelli piccoli ed efficienti possono offrire prestazioni elevate con una formazione adeguata.”

Stability afferma in chiusura che rilascerà un rapporto tecnico completo su StableLM “nel prossimo futuro”.

Fonte: Ars Technica
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
25 apr 2023
Link copiato negli appunti