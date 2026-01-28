Gemini 3 Flash è stato annunciato a metà dicembre 2025. Google ha introdotto ieri sera una nuova capacità, denominata Agentic Vision. Può essere sfruttata per comprendere il contenuto delle immagini. Combinando questo ragionamento visivo con l’esecuzione di codice, il modello formula piani per ingrandire, ispezionare e manipolare le immagini passo dopo passo.

Agentic Vision di Gemini 3 Flash

Google scrive che Agentic Vision introduce un loop agentico (Think, Act, Observe) nelle attività di comprensione delle immagini. Durante la fase Think, Gemini 3 Flash analizza la query dell’utente e l’immagine iniziale, formulando un piano multi-step. Durante la fase Act, il modello genera ed esegue codice Python per manipolare attivamente le immagini (ritaglio, rotazione, annotazione e altro) o per analizzarle (ad esempio eseguendo calcoli o contando riquadri di delimitazione).

Durante l’ultima fase Observe, l’immagine trasformata viene aggiunta alla finestra di contesto. Ciò consente al modello di analizzare i nuovi dati con un contesto migliore prima di generare una risposta finale. Sono disponibili diverse app dimostrative in Google AI Studio che consentono di testare il ragionamento visivo di Gemini 3 Flash.

Agentic Vision verrà ulteriormente migliorato nelle prossime settimane. Google ha elencato tre novità in arrivo. La prima consentirà a Gemini 3 Flash di effettuare calcoli matematici, la rotazione delle immagini e altre modifiche senza un input esplicito, come già avviene per lo zoom.

È previsto inoltre il supporto per la ricerca web e la ricerca inversa delle immagini. Infine, queste capacità verranno aggiunte alle altri modelli della famiglia Gemini 3. Gli sviluppatori possono usare Agentic Vision tramite Google AI Studio e Vertex AI. Gli utenti troveranno la novità nell’app Gemini (deve essere selezionata l’opzione Ragionamento dal menu a discesa).

L’azienda di Mountain View ha esteso l’abbonamento Google AI Plus a 35 paesi, Italia inclusa. Gemini 3 è invece diventato il modello predefinito di AI Overview.