Meta ha annunciato la sottoscrizione di un nuovo accordo con Amazon Web Services (AWS) per la fornitura di milioni di chip Graviton5. Verranno installati nei data center dell’azienda di Menlo Park e sfruttati dagli agenti AI. Circa un mese fa erano arrivati i nuovi chip MTIA per addestramento e inferenza dei modelli AI.
Milioni di CPU Arm per l’elaborazione agentica
Meta utilizza l’infrastruttura cloud di AWS da diversi anni per tutte le sue attività, non solo quelle relative all’intelligenza artificiale (tra i fornitori ci sono anche Google Cloud e Microsoft Azure). Questa partnership viene quindi estesa ai chip della famiglia Graviton. In particolare, l’azienda di Menlo Park utilizzerà i nuovi Graviton5 per gli agenti AI.
I chip AWS Trainium possono elaborare grandi quantità di dati in parallelo, quindi sono più adatti all’addestramento dei modelli AI (come le GPU). Gli agenti AI possono eseguire azioni per conto dell’utente raggiungendo l’obiettivo finale attraverso l’esecuzione di passi multipli. Questo è un compito più adatto alle CPU.
AWS Graviton5 è una CPU a 3 nanometri basata su architettura Arm con 192 core e una cache L3 cinque volte più grande della precedente generazione. Ciò permette di ottenere prestazioni fino al 25% superiori e una latenza inferiore, caratteristiche essenziali per l’esecuzione delle operazioni agentiche.
Nel comunicato stampa di Amazon è scritto che Meta è all’avanguardia nello sviluppo dell’AI agentica. Probabilmente è un riferimento alla nuova famiglia di modelli Muse. All’inizio del mese è stato annunciato Muse Spark che risponde a domande complesse assegnando i singoli compiti a subagenti. In futuro dovrebbe arrivare anche un modello che esegue azioni in autonomia.