Il nuovo modello linguistico open-source “Smaug-72B” è stato incoronato oggi da Hugging Face come il migliore sistema di intelligenza artificiale al mondo per l’elaborazione del linguaggio naturale (NLP). Rilasciato dalla startup Abacus AI che supporta le aziende con soluzioni di AI, è una versione ottimizzata di “Qwen-72B”, un altro influente modello creato pochi mesi fa dal team di ricercatori Alibaba Qwen.
Secondo la classifica stilata da Hugging Face, Smaug-72B rappresenta lo stato dell’arte per la comprensione e la generazione del linguaggio umano da parte dei sistemi AI.
Smaug-72B è il nuovo re dei modelli linguistici open source
L’aspetto interessante è che Smaug-72B è supera modelli all’avanguardia come GPT-3.5 di OpenAI e Mistral, nonché il suo predecessore Qwen-72B, in diversi benchmark di riferimento per i modelli linguistici. Secondo la classifica Hugging Face, Smaug-72B è il primo sistema ad ottenere un punteggio medio superiore a 80 in tutte le principali valutazioni, dimostrando capacità superiori nella comprensione e generazione del linguaggio.
Nonostante Smaug-72B non raggiunga ancora un punteggio medio di 90-100, indicativo delle prestazioni di un essere umano, il suo rilascio è indice del fatto che l’intelligenza artificiale open source sta rapidamente colmando il divario con i modelli proprietari delle Big Tech, a lungo avvolti nel segreto.
Abacus AI ha applicato al suo modello delle tecniche specifiche per migliorare il ragionamento e le abilità matematiche. Ecco perché Smaug-72B è in grado di eccellere nei compiti di ragionamento e matematica, superando i limiti dei modelli linguistici di grandi dimensioni.
Qwen 1.5: la suite di modelli linguistici open-source
Smaug-72B non è l’unico modello linguistico open-source di successo. Qwen, il gruppo che ha creato Qwen-72B, ha lanciato Qwen 1.5, una suite di modelli linguistici open-source che vanno da 0,5B a 72B parametri. Qwen 1.5 supera i modelli open-source più popolari, come Mistral e GPT-3.5, ha una lunghezza di contesto di 32k. Funziona con diversi strumenti e piattaforme per un’inferenza rapida e locale. Qwen ha anche rilasciato Qwen-VL-Max, un modello di linguaggio open-source di grandi dimensioni che compete con Gemini Ultra e GPT-4V, due dei modelli di linguaggio proprietari più avanzati di Google e OpenAI.
Il futuro dell’IA open-source
Smaug-72B e Qwen 1.5 hanno generato molto entusiasmo e dibattito nella comunità dell’IA e oltre. Molti esperti e influencer hanno elogiato i risultati di Abacus AI e Qwen e hanno mostrato la loro ammirazione per il loro contributo all’IA open-source. “È incredibile come in meno di un anno i modelli open-source siano progrediti così tanto”, ha commentato Sahar Mor, analista e influencer di AI, in un post su Linkedin.
Smaug-72B e Qwen 1.5 sono ora disponibili su Hugging Face, dove chiunque può scaricarli, utilizzarli e modificarli. Abacus AI e Qwen hanno anche espresso la loro intenzione di partecipare alla llmsys human eval leaderboard. Si tratta di un nuovo benchmark che valuta le prestazioni dei modelli linguistici su compiti e scenari umani. Abacus AI e Qwen hanno anche anticipato i loro piani e obiettivi futuri, che includono la creazione di altri modelli open-source e la loro applicazione a vari domini e applicazioni.