MT-NLG: l'AI di Microsoft e Nvidia fa un passo avanti

MT-NLG: l'AI di Microsoft e Nvidia fa un passo avanti

Microsoft e Nvidia hanno sviluppato DeepSpeed- and Megatron-powered Megatron-Turing Natural Language Generation, modello di IA per il linguaggio naturale.
MT-NLG: l'AI di Microsoft e Nvidia fa un passo avanti
Microsoft e Nvidia hanno sviluppato DeepSpeed- and Megatron-powered Megatron-Turing Natural Language Generation, modello di IA per il linguaggio naturale.

MT-NLG significa un passo avanti, molto lungo peraltro. MT-NLG significa Intelligenza Artificiale, ai massimi livelli, mettendo assieme due esperienze software avanzate e competenze hardware utili a reggere questo tipo di operazioni. MT-NLG, ossia “DeepSpeed- and Megatron-powered Megatron-Turing Natural Language Generation“, è il modello di un nuovo tipo di Intelligenza Artificiale applicata al linguaggio naturale per riuscire laddove i modelli fino ad oggi esistenti non erano ancora riusciti ad arrivare.

MT-NLG

Secondo quanto annunciato da Microsoft e Nvidia, il lavoro mette assieme 530 miliardi di parametri con l’obiettivo di parallelizzare e ottimizzare modelli IA di grandi dimensioni. Ecco il risultato: un nuovo modello, tre volte più ampio dei precedenti, in grado di raggiungere i seguenti obiettivi con ben maggior precisione rispetto ai precedenti Turing NLG 17B e Megatron-LM:

  • previsioni di completamento
  • comprensione in lettura
  • comprensione del senso comune
  • gestione delle inferenze del linguaggio naturale
  • disambiguazione del significato delle parole

Il quantitativo di dati gestiti non è un aspetto secondario: proprio la capacità di gestire in parallelo un alto numero di parametri consente a modelli di machine learning di questo tipo di procedere più rapidamente e precisamente verso l’obiettivo, facendo leva su grandi dataset per rendere l’apprendimento più rapido ed efficiente possibile.

Megatron-Turing Natural Language Generation

Il grande lavoro compiuto a livello di algoritmi fa il paio con un importante lavoro hardware basato su 560 supercomputer DGX A100, necessario per poter supportare in modo ottimizzato la grande potenza di calcolo necessaria. Il resto dei dettagli tecnici è contenuto nell’apposito report Microsoft denso di tecnicaglie per appassionati di IA. Il sapore è quello di una forza bruta senza precedenti, messa al servizio di un modello incentrato sulla comprensione e la decodifica del linguaggio naturale. Il percorso, spiega Microsoft, è ancora lungo: il passo odierno è comunque decisamente ampio, tale da avvicinare ulteriormente un obiettivo che potrebbe far incontrare definitivamente l’uomo e la macchina sulla matrice comune del linguaggio umano.

Fonte: Microsoft
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
12 ott 2021
Link copiato negli appunti