Reka sfida GPT-4 e Claude 3 con il modello AI Reka Core

Reka sfida GPT-4 e Claude 3 con il modello AI Reka Core

Reka ha presentato Reka Core, il suo nuovo grande modello linguistico multimodale addestrato da zero, per competere con OpenAI, Google e Anthropic.
Reka sfida GPT-4 e Claude 3 con il modello AI Reka Core
Reka ha presentato Reka Core, il suo nuovo grande modello linguistico multimodale addestrato da zero, per competere con OpenAI, Google e Anthropic.

Reka, la startup AI con sede a San Francisco fondata da un team di ex ricercatori di DeepMind, Google e Meta, ha appena svelato Reka Core. Addestrato da zero utilizzando migliaia di GPU, Core promette di rivoluzionare il modo in cui interagiamo con l’AI.

Core è il terzo membro della famiglia di modelli linguistici di Reka ed è disponibile tramite API, opzioni di distribuzione on-premise o su dispositivo.

Reka Core, un modello multimodale all’avanguardia

Reka Core si distingue per la sua capacità di comprendere più modalità di input, tra cui immagini, audio e video, oltre al testo. Nonostante sia stato addestrato in meno di un anno, questo modello è già in grado di eguagliare o superare le prestazioni dei modelli rivali come ChatGPT 4, Claude 3 Opus e Gemini  Pro 1.5. La rapidità con cui Reka ha sviluppato un modello così performante è una testimonianza delle capacità uniche dell’azienda.

Sebbene le dimensioni esatte di Reka Core non siano state divulgate, il CEO Dani Yogatama lo descrive come un “modello molto grande“. Addestrato su una vasta gamma di dati, tra cui testo, audio, video e immagini, Core eccelle in compiti che vanno dalla matematica alla codifica, dimostrando un elevato livello di ragionamento. Con il supporto per 32 lingue e una finestra contestuale di 128.000 token, questo modello è ben attrezzato per recepire ed elaborare grandi quantità di informazioni diverse in una sola volta.

Nei benchmark del settore, Reka Core si è dimostrato all’altezza dei leader del settore. Ha superato il suo unico concorrente, Gemini Ultra di Google, nel test di percezione video e si è piazzato subito dopo i modelli di punta di OpenAI, Google e Anthropic nel benchmark MMMU per le attività di immagine. Core ha anche ottenuto punteggi impressionanti nei test di conoscenza MMLU, ragionamento GSM8K e codifica HumanEval, battendo persino GPT-4 in alcuni casi.

Un approccio innovativo

Per raggiungere questo livello di prestazioni in così poco tempo, Reka ha adottato un approccio unico. Invece di addestrare semplicemente un modello e vedere dove arriva, l’azienda ha iniziato con un livello di prestazioni mirato e ha lavorato a ritroso per determinare il modo più efficiente per raggiungerlo. Questa metodologia ha permesso a Reka di ottimizzare l’uso dei dati di addestramento e delle risorse di calcolo.

Le partnership in cantiere

Grazie al focus sulle capacità multimodali e i prezzi competitivi, Reka mira a sbloccare nuovi casi d’uso per i clienti in diversi settori, tra cui l’e-commerce, i giochi, la sanità e la robotica. L’azienda ha già stretto partnership con Snowflake, Oracle e AI Singapore, e sta riscontrando un forte interesse da parte delle imprese.

Insomma, sebbene Reka sia ancora in fase nascente, ce la sta mettendo davvero tutta per contrastare il dominio di OpenAI, Anthropic e Google nel settore dell’AI.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
16 apr 2024
Link copiato negli appunti