Progettato fin dalle sue fondamenta per essere multimodale, Gemini è il nuovo e più grande modello IA messo a punto da Google. L’annuncio ufficiale di oggi ribadisce quanto già emerso in precedenza e le ambizioni di bigG nell’ambito dell’intelligenza artificiale.

Google presenta Gemini, il suo modello IA più avanzato

Quali sono le sue potenzialità? È in grado di generalizzare, comprendere, operare e combinare senza discontinuità diverse tipologie di informazioni: dal testo alle immagini, dall’audio al video, fino al codice.

I test condotti fanno riferimento a prestazioni superiori a quelle dei migliori modelli in circolazione per 29 dei 32 benchmark accademici di settore utilizzati nell’ambito LLM (Large Language Model).

Un modello, tre versioni: Ultra, Pro e Nano

Il gruppo di Mountain View ha reso noto che la prima versione è ottimizzata per tre dimensioni differenti.

Ultra , il modello più grande e potente, per compiti altamente complessi;

, il modello più grande e potente, per compiti altamente complessi; Pro , il modello migliore per essere applicato su scala a un’ampia gamma di attività;

, il modello migliore per essere applicato su scala a un’ampia gamma di attività; Nano, il modello più efficiente per attività da svolgere su un singolo dispositivo (on-device).

Stando a quanto dichiarato da bigG, le capacità di Gemini torneranno utile in particolare nel far emergere conoscenze che possono essere difficili da individuare all’interno di una grande quantità di dati. Un punto di forza, questo, che secondo Google contribuirà ad accelerare l’innovazione in molti campi, dalla scienza alla finanza.

L’annuncio pone l’accento anche sul tema della sicurezza. Il team al lavoro sul progetto afferma di aver condotto ricerche mirate e di aver applicato tecniche di adversial testing per identificare problemi critici e per implementare gli accorgimenti necessari a contrastare il fenomeno dei pregiudizi impliciti (bias).

La disponibilità

Quando sarà possibile mettere alla prova Gemini? Fin da subito, in 170 paesi di tutto il mondo, anche se inizialmente solo con supporto per la lingua inglese. Google afferma che il rollout è già stato avviato e che l’implementazione del modello è immediata in diversi prodotti e piattaforme del gruppo. Uno di questi è il chatbot Bard.

Gemini Nano sarà inoltre integrato nello smartphone Pixel 8 Pro, eseguito in locale per aiutare l’utente in operazioni come la creazione di riassunti nell’app Recorder e nella stesura di risposte automatiche in WhatsApp, passando dalla tastiera Gboard. Entro i prossimi mesi arriverà anche in Chrome, Ads, nel motore di ricerca e in Duet.