Google continua a migliorare Gemini con l’intento di trasformarlo nell’AI preferita dagli utenti. Dopo il lancio di Gemini 2.0 Flash, ha annunciato due novità interessanti per Imagen 3, il generatore di immagini della piattaforma. La prima: è possibile dare istruzioni disegnando o annotando direttamente sulle immagini invece di scrivere prompt dettagliati. La seconda: SynthID, il sistema di watermark di Google, che ora funziona anche sui video.
Sin dal suo debutto, Imagen 3 è stato un successone. Gli utenti hanno lodato l’efficacia e la qualità delle immagini generate, tanto che Google ha iniziato a piazzare l’AI ovunque… Potrebbe presto arrivare in Google Search, nella barra di ricerca di Chrome su Android, e ha già fatto il suo ingresso in Adobe Photoshop. Ma Google non si accontenta del successo iniziale e continua ad aggiungere funzionalità.
Addio prompt su Gemini, ora si disegna o si annota direttamente sull’immagine
Ora non serve più scervellarsi per scrivere un prompt dettagliato, basta indicare dove e come applicare le modifiche disegnando o annotando sulle immagini direttamente nell’applicazione. Il processo è semplice. Si apre l’app Gemini, si seleziona “Crea un’immagine”, si importa l’immagine che si vuole modificare, si clicca sopra, e si usa lo strumento “Sketch” per disegnare le istruzioni oppure lo strumento “Text” per annotarle. Si preme OK, si invia, e Gemini elabora la richiesta visiva invece che testuale.
Se il risultato non soddisfa completamente, si può sempre affinare la richiesta con un prompt testuale. È un sistema ibrido. Anche perché ci sono situazioni in cui disegnare cosa si ha in mente è più efficace che descriverlo a parole.
C’è differenza tra dire: Aggiungi un albero sul lato sinistro dell’immagine, circa a metà altezza, leggermente spostato verso il centro
e scarabocchiare semplicemente un albero nel punto esatto dove si desidera. Il disegno comunica la posizione, la dimensione approssimativa e il contesto spaziale in un modo che il linguaggio naturale fatica a replicare senza diventare verboso. La funzione è disponibile su Android, iOS e sul web.
SynthID esteso ai video: ora è possibile verificare se un video è AI
L’altra novità annunciata insieme a Gemini 2.0 Flash riguarda SynthID, il sistema di watermark proprietario di Google per identificare contenuti generati dall’AI. Finora funzionava solo sulle immagini, ma Google ha esteso la verifica anche ai video.
Basta importare un video su Gemini e chiedere se è stato generato o modificato dall’AI di Google. Gemini analizza sia la traccia audio che le immagini a caccia del watermark SynthID. Se lo trova, indica anche quali parti sono state generate o modificate.
Tuttavia, la funzione ha un limite fondamentale, rileva solo contenuti generati dall’AI di Google. Se il video è stato creato con Sora di OpenAI ad esempio, o qualsiasi altro strumento, Gemini non può dire nulla. Il watermark SynthID è proprietario e funziona solo all’interno dell’ecosistema Google.