Nasce Dolly 2.0, modello di linguaggio open source che sfida ChatGPT

Aggiungi Punto Informatico come Fonte preferita su Google

Sul mercato internazionale stanno arrivando sempre più soluzioni alternative a ChatGPT: ad esempio, recentemente Alibaba ha svelato la sua IA rivale, Tongyi Qianwen, che tuttavia resterà limitata entro i confini del Dragone. In Occidente, invece, è la società americana Databricks a rilasciare il primo modello di linguaggio di grandi dimensioni (LLM) open source messo a punto su dati umani: si chiama Dolly 2.0 e potrebbe fungere da nuova base per i servizi concorrenti di ChatGPT.

Arriva Dolly 2.0, il rivale open source di ChatGPT

Con i suoi 12 miliardi di parametri usati per l’addestramento, Dolly 2.0 si propone come modello di linguaggio completamente gratuito e open source utilizzabile “senza pagare per l’accesso API o condividere dati con terze parti”. Si tratta di un salto importante rispetto alla prima iterazione Dolly 1.0, rilasciata lo scorso marzo e limitata commercialmente in quanto utilizzava dati di addestramento provenienti da ChatGPT, ergo soggetti ai termini di servizio di OpenAI.

Il nuovo set di dati creato tra inizio marzo e queste prime settimane di aprile tramite crowdsourcing, al contrario, è soggetto alla licenza Creative Commons e, pertanto, può essere utilizzato, modificato ed esteso per qualsiasi scopo, incluse le applicazioni commerciali.

ChatGPT OpenAI Logo

Scendendo nel dettaglio, il modello databricks-dolly-15k su cui Dolly 2.0 si basa è stato generato con informazioni di alta qualità, può offrire risposte lunghe alla maggior parte delle richieste e gode del supporto di molteplici professionisti da più settori.

Queste le parole conclusive di Databricks:

“Abbiamo sentito ripetutamente dai nostri clienti che sarebbero serviti meglio se possedessero i loro modelli, consentendo loro di creare soluzioni di qualità superiore per le loro applicazioni specifiche senza consegnare i loro dati sensibili a terzi. Riteniamo inoltre che le questioni importanti di parzialità, responsabilità e sicurezza dell’IA dovrebbero essere affrontate da un’ampia comunità di diverse parti interessate piuttosto che solo da poche grandi aziende. I set di dati e i modelli dall’origine aperta incoraggiano commenti, ricerca e innovazione che contribuiranno a garantire che tutti traggano vantaggio dai progressi della tecnologia dell’intelligenza artificiale.”

Fonte: Databricks

Francesco Santin

Pubblicato il 14 apr 2023