AMD ha recentemente annunciato il lancio di “Instella”, una nuova famiglia di modelli linguistici open-source con 3 miliardi di parametri, segnando un passo significativo nel mondo dell’intelligenza artificiale accessibile a tutti. Questo progetto, reso appena pubblico, si distingue per la sua natura completamente aperta: non solo il codice sorgente è disponibile, ma anche i pesi dei modelli, le configurazioni di addestramento e i dataset utilizzati sono stati condivisi con la comunità globale, in modo da promuovere l’innovazione e la collaborazione nel campo dell’IA, rendendo queste risorse liberamente accessibili a sviluppatori, ricercatori e aziende.
AMD Instella: i nuovi modelli di linguaggio da 3 miliardi di parametri
I modelli AMD Instella si posizionano come una soluzione versatile, ottimizzata per eseguire operazioni di inferenza efficienti su hardware AMD, ma anche compatibile con altre piattaforme grazie alla loro natura open-source. Si tratta di modelli completamente aperti e all’avanguardia, addestrati su GPU Instict MI300X. Questi, secondo i dati condivisi dall’azienda, riescono a garantire prestazioni elevate e altrettanto competitive rispetto ad altri modelli come Llama 3.2 3B, Gemma-2 2B e Qwen 2.5 3B.
Si tratta di una mossa che mira a rafforzare l’ecosistema software IA dell’azienda, un aspetto naturalmente sempre più cruciale nella competizione con giganti come NVIDIA.
“Completamente aperto e accessibile: rilascio completamente open source di pesi modello, iperparametri di training, set di dati e codice, promuovendo innovazione e collaborazione all’interno della comunità AI.
…
Rendendo completamente open source i modelli Instella, inclusi pesi, configurazioni di training, set di dati e codice, puntiamo a promuovere innovazione e collaborazione all’interno della comunità AI. Crediamo che trasparenza, riproducibilità e accessibilità siano fattori chiave del progresso nella ricerca e nello sviluppo AI. Invitiamo sviluppatori, ricercatori e appassionati di AI a esplorare Instella, contribuire al suo continuo miglioramento e unirsi a noi per superare i confini di ciò che è possibile con i modelli linguistici.”
Tutti i dettagli sui nuovi modelli di linguaggio Instella AMD sono disponibili sul blog ROCm, ospitato su GitHub.