X.ai, la startup di Elon Musk specializzata in intelligenza artificiale, ha presentato il suo ultimo modello di AI generativa, Grok-1.5. Il nuovo modello è destinato ad alimentare il chatbot Grok del social network X “nei prossimi giorni”, come scrive X.ai in un post sul blog. Le specifiche e i risultati dei benchmark pubblicati da X suggeriscono che Grok-1.5 rappresenti un significativo miglioramento rispetto al suo predecessore.

Ragionamento potenziato e prestazioni superiori nei benchmark

Grok-1.5 vanta un “ragionamento migliorato”, in particolare per quanto riguarda la codifica e i compiti matematici. Il modello ha ottenuto risultati notevoli in due benchmark di riferimento: ha più che raddoppiato il punteggio di Grok-1 nel test matematico MATH e ha registrato un incremento di oltre dieci punti percentuali nel test HumanEval, che valuta la generazione di linguaggi di programmazione e la capacità di problem-solving. Tuttavia, è importante considerare che questi benchmark, pur essendo comunemente utilizzati, non sempre riflettono fedelmente il modo in cui la persona media interagisce con i modelli di AI nella vita quotidiana.

Un contesto più ampio per una migliore comprensione

Una delle principali novità di Grok-1.5 è l’ampliamento della finestra di contesto, che ora raggiunge i 128.000 token. Questo si traduce in una maggiore capacità del modello di recepire e utilizzare informazioni provenienti da documenti più lunghi, gestendo al contempo richieste più articolate e complesse. Grazie a questa caratteristica, Grok-1.5 dovrebbe essere in grado di seguire meglio il flusso delle conversazioni e di evitare le “dimenticanze” tipiche dei modelli con contesti più ristretti.

Disponibilità imminente su X e nuove funzionalità

X.ai ha annunciato che Grok-1.5 sarà presto accessibile ai primi tester su X e sarà accompagnato da “diverse nuove funzionalità“. Tra le possibili novità, già anticipate da Musk, ci sono la capacità di riassumere discussioni e risposte e di suggerire contenuti per i post. Non è chiaro, invece, se Grok-1.5 manterrà le caratteristiche distintive dei precedente modello Grok, noto per la sua propensione a rispondere a domande su argomenti controversi e a utilizzare un linguaggio scortese se richiesto.

L’annuncio di Grok-1.5 arriva dopo il rilascio di Grok-1, disponibile però senza il codice necessario per perfezionarlo o addestrarlo ulteriormente. Recentemente, Musk ha dichiarato che un maggior numero di utenti di X, in particolare quelli abbonati al piano Premium da 8 dollari al mese, avranno accesso a Grok, il chatbot precedentemente riservato ai clienti di X Premium+ (che pagano 16 dollari al mese).