Google lancia un nuovo modello AI che promette prestazioni elevate senza sacrificare l’efficienza. Si chiama Gemini 2.5 Flash e sarà presto disponibile su Vertex AI, la piattaforma di sviluppo AI di Google, dove tra l’altro, Big G ha annunciato la disponibilità del nuovo modello Lyria.

Nuovo modello AI Gemini 2.5 Flash di Google

La vera forza di Gemini 2.5 Flash sta nella sua flessibilità operativa: è progettato per adattarsi alle esigenze di ogni sviluppatore. Grazie a quello che Google definisce “computing dinamico e controllabile“, è possibile regolare il tempo di elaborazione in base alla complessità della richiesta.

In pratica, se la query è semplice, il modello può rispondere rapidamente usando meno risorse. Con domande più articolate, invece, si prende più tempo per rispondere e utilizza più risorse. È un po’ come quando noi calibriamo lo sforzo in base alla difficoltà: risparmiamo energie sulle cose banali per concentrarci su quelle complesse. Questo adattamento continuo permette di non sprecare risorse inutilmente.

Google definisce Gemini 2.5 Flash come un modello “da lavoro”, ideale per applicazioni ad alto volume e in tempo reale, come l’assistenza clienti e l’analisi dei documenti. Ma le novità non finiscono qui. Grazie alla collaborazione con Nvidia, Google estenderà la disponibilità dei suoi modelli Gemini – incluso il nuovo Gemini 2.5 Flash – anche negli ambienti on-premises, cioè installati direttamente nei data center delle aziende, e non solo nel cloud.

Un modello misterioso?

C’è però un piccolo neo in tutta questa storia. Google non ha pubblicato un rapporto sulla sicurezza o sulle specifiche tecniche di Gemini 2.5 Flash. Questo rende più difficile capire dove il modello eccelle e dove invece lascia a desiderare. Big G ha spiegato a TechCrunch che non rilascia rapporti per i modelli che considera “sperimentali”.