Google DeepMind ha annunciato due nuovi modelli AI, denominati Gemini Robotics e Gemini Robotics-ER, basati su Gemini 2.0. Come si deduce dal nome sono stati sviluppati per la robotica. Offrono prestazioni elevate in quattro aree: generalità, interattività, abilità e comprensione del mondo circostante.
Robot con Gemini 2.0
Carolina Parada, responsabile della robotica di Google DeepMind, evidenzia che i modelli Gemini 2.0 possono risolvere problemi complessi attraverso un ragionamento multimodale (testo, immagini, audio e video), ma queste capacità sono confinate nel mondo digitale.
I due modelli per la robotica portano Gemini 2.0 nel mondo fisico. Gemini Robotics è un modello VLA (visione-linguaggio-azione) che permette di aggiungere tre capacità ai robot: generalità, interattività e abilità. Per generalità si intende la capacità di adattarsi a differenti situazioni e quindi risolvere anche compiti mai visti durante l’addestramento.
Per interattività si intende la capacità di interagire con le persone e l’ambiente circostante. Il robot può comprendere e rispondere ai comandi in diverse lingue, rilevare i cambiamenti dell’ambiente o delle istruzioni e modificare le azioni.
Per abilità si intende la capacità di eseguire azioni complesse, come la manipolazione degli oggetti, compito molto semplice per gli umani ma non per i robot.
Gemini Robotics-ER (Embodied Reasoning) è invece un modello VL (visione-linguaggio) che fornisce al robot il ragionamento spaziale, ovvero la capacità di individuare la posizione degli oggetti e come devono essere presi. Se ad esempio gli viene mostrata una tazza da caffè può intuire la giusta presa con due dita per prenderla dal manico e una traiettoria sicura per avvicinarsi.
I due modelli sono stati testati con vari tipi di robot. Google DeepMind ha avviato una collaborazione con Apptronik per sviluppare una nuova generazione di robot umanoidi basati su Gemini 2.0. Gemini Robotics-ER viene testato anche da alcuni partner, tra cui Agile Robots, Agility Robots, Boston Dynamics e Enchanted Tools.