Nasce Dolly 2.0, modello di linguaggio open source che sfida ChatGPT

Nasce Dolly 2.0, modello di linguaggio open source che sfida ChatGPT

Sul mercato internazionale stanno arrivando sempre più soluzioni alternative a ChatGPT: ad esempio, recentemente Alibaba ha svelato la sua IA rivale, Tongyi Qianwen, che tuttavia resterà limitata entro i confini del Dragone. In Occidente, invece, è la società americana Databricks a rilasciare il primo modello di linguaggio di grandi dimensioni (LLM) open source messo a punto su dati umani: si chiama Dolly 2.0 e potrebbe fungere da nuova base per i servizi concorrenti di ChatGPT.

Arriva Dolly 2.0, il rivale open source di ChatGPT

Con i suoi 12 miliardi di parametri usati per l’addestramento, Dolly 2.0 si propone come modello di linguaggio completamente gratuito e open source utilizzabile “senza pagare per l’accesso API o condividere dati con terze parti”. Si tratta di un salto importante rispetto alla prima iterazione Dolly 1.0, rilasciata lo scorso marzo e limitata commercialmente in quanto utilizzava dati di addestramento provenienti da ChatGPT, ergo soggetti ai termini di servizio di OpenAI.

Il nuovo set di dati creato tra inizio marzo e queste prime settimane di aprile tramite crowdsourcing, al contrario, è soggetto alla licenza Creative Commons e, pertanto, può essere utilizzato, modificato ed esteso per qualsiasi scopo, incluse le applicazioni commerciali.

ChatGPT OpenAI Logo

Scendendo nel dettaglio, il modello databricks-dolly-15k su cui Dolly 2.0 si basa è stato generato con informazioni di alta qualità, può offrire risposte lunghe alla maggior parte delle richieste e gode del supporto di molteplici professionisti da più settori.

Queste le parole conclusive di Databricks:

“Abbiamo sentito ripetutamente dai nostri clienti che sarebbero serviti meglio se possedessero i loro modelli, consentendo loro di creare soluzioni di qualità superiore per le loro applicazioni specifiche senza consegnare i loro dati sensibili a terzi. Riteniamo inoltre che le questioni importanti di parzialità, responsabilità e sicurezza dell’IA dovrebbero essere affrontate da un’ampia comunità di diverse parti interessate piuttosto che solo da poche grandi aziende. I set di dati e i modelli dall’origine aperta incoraggiano commenti, ricerca e innovazione che contribuiranno a garantire che tutti traggano vantaggio dai progressi della tecnologia dell’intelligenza artificiale.”

Fonte: Databricks
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
14 apr 2023
Link copiato negli appunti