Tra le novità annunciate da NVIDIA durante la conferenza GTC 2022 c’è Hopper, la nuova architettura per GPU server che sostituisce la precedente Ampere. Il primo modello è H100 che arriverà sul mercato nel terzo trimestre. Utilizzando otto GPU H100, l’azienda californiana realizzerà i sistemi DGX di quarta generazione che verranno integrati nel supercomputer Eos.

NVIDIA Hopper e H100

L’architettura Hopper è stata progettata per migliorare le prestazioni dei server utilizzati sia dalle piccole aziende che per i sistemi HPC. NVIDIA sottolinea che le GPU permettono di velocizzare di un ordine di grandezza i calcoli necessari per le applicazioni di intelligenza artificiale. H100 viene realizzata da TSMC con tecnologia di processo a 4 nanometri e integra 80 miliardi di transistor.

La GPU ha 16.896 CUDA core, 768 Tensore core e 80 GB di memoria HBM3 che offrono una larghezza di banda fino a 3 TB/sec. NVIDIA afferma che 20 GPU H100 possono gestire l’equivalente dell’intero traffico Internet mondiale. La GPU supporta lo standard PCI Express 5.0, mentre il collegamento con altre GPU avviene tramite NVLink di quarta generazione. Il TDP è 700 Watt per la versione per server ad altre prestazioni (formato SXM) e 350 Watt per la versione per server mainstream (formato PCIe).

Il sistema DGX H100 integra otto GPU H100 collegate tra loro con NVLink. Sfruttando la connessione esterna NVLink Switch è possibile combinare fino a 32 nodi DGX H100 (per un totale di 256 GPU) che verranno utilizzati nei futuri supercomputer DGX SuperPOD. NVIDIA realizzerà il supercomputer Eos con 576 sistemi DGX H100 che offrirà prestazioni IA quattro volte superiori a quelle del supercomputer giapponese Fugaku, attualmente il più veloce del mondo.