L’azienda californiana ha annunciato Inflection-2, il primo modello al mondo nella sua classe di calcolo e il secondo in assoluto dopo GPT-4 di OpenAI. Si tratta della versione aggiornata del modello, introdotto solo cinque mesi fa, alla base di Pi, il chatbot concorrente di ChatGPT, Microsoft Copilot (ex Bing Chat), Claude, Google Bard e Grok.
Inflection-2 batte (quasi) tutti i modelli IA
Inflection-2 è stato addestrato con 5.000 GPU NVIDIA H100 (circa 1025 FLOPS), quindi appartiene alla stessa classe di calcolo di PaLM 2 Large. Tuttavia, il nuovo modello di Inflection supera quello di Google in quasi tutti i benchmark IA più utilizzati (MMLU, TriviaQA, HellaSwag e GSM8k).
Inflection-2 verrà presto utilizzato per il chatbot Pi, ma prima devono essere apportare alcune ottimizzazioni, soprattutto sul fronte della sicurezza. Grazie al passaggio dalle GPU NVIDIA A100 alle H100 è stato velocizzato il training e ridotti i costi. L’azienda californiana ha già previsto l’addestramento di modelli più grandi, sfruttando la massima potenza del cluster formato da 22.000 GPU H100.
Inflection ha pubblicato una serie di benchmark per dimostrare le prestazioni superiori a quelle degli LLM (Large Language Model) più noti, tra cui Llama-2 (Meta), GPT-3.5 (OpenAI), Grok-1 (xAI), PaLM 2 (Google) e Claude (Anthropic). Secondo il benchmark MMLU, Inflection-2 è inferiore solo a GPT-4. Inflection-2 non ha un addestramento specifico per la scrittura di codice e nel ragionamento matematico. Tuttavia, vari benchmark evidenziano che viene superato solo da GPT-4.
Per interagire con Pi è possibile usare l’interfaccia web o l’app iOS. Gli utenti possono inoltre avviare una conversazione su WhatsApp, Instagram, Telegram e Facebook Messenger.