Arm non offrirà solo le licenze sul design dei chip. Per la prima volta in oltre 35 anni di storia venderà un suo chip. L’azienda di Cambridge (Regno Unito) ha progettato AGI CPU per data center AI. Verrà sfruttato per l’inferenza dei modelli AI e la gestione dei carichi di lavoro associati agli agenti AI. Il primo cliente è Meta che ha partecipato allo sviluppo del chip.
Arm AGI CPU: specifiche del chip
Arm spiega nel comunicato stampa che l’incremento delle capacità agentiche dei sistemi AI richiede un’enorme potenza di calcolo. Le CPU installate nei data center (principalmente basate sull’architettura x86) non riescono a gestire il carico di lavoro e quindi rappresentano un collo di bottiglia. La soluzione è AGI CPU.
Arm offrirà tre versioni. AGI CPU 136C integra 136 core Neoverse V3 con frequenza massima di 3,2 GHz e 128 MB di cache L2 per core. AGI CPU 128C e AGI CPU 64C hanno invece 128 e 64 core, rispettivamente. La CPU, realizzata con tecnologia di processo a 3 nanometri da TSMC, supporta fino a 12 moduli RDIMM di memoria DDR5-8800 (larghezza di banda fino a 6 GB/s per core) e 96 linee PCIe 6.0. Il TDP è 300 Watt.
Può essere installato in server da 30 rack 1U con raffreddamento ad aria per un totale di 8.160 CPU oppure in server da 42 rack 1U con raffreddamento a liquido per un totale di 45.656 CPU. A parità di consumo (32 kW) offre prestazioni doppie rispetto alle CPU x86.
Il primo e principale cliente è Meta che affiancherà le AGI CPU di Arm ai suoi chip MTIA. Altri clienti sono Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP e SK Telecom. I sistemi commerciali possono essere ordinati da ASRock Rack, Lenovo, Quanta Computer e Supermicro.