Google ha annunciato un importante aggiornamento per il suo chatbot AI. Ora Gemini permette di modificare sia le immagini generate dall’AI che quelle caricate dagli utenti dal proprio telefono o computer.
Editing nativo delle immagini con Gemini
L’editing nativo delle immagini in Gemini inizia a essere disponibile da oggi, con un roll out graduale. Nelle prossime settimane, il servizio arriverà nella maggior parte dei Paesi e supporterà oltre 45 lingue.
Il lancio segue il modello AI di editing delle immagini che Google aveva già sperimentato a marzo nella sua piattaforma AI Studio. Lo strumento era diventato virale per la sua controversa capacità di rimuovere i watermark da qualsiasi immagine.
Gemini offre ora un flusso di editing “multi-step” che, secondo Big G, fornisce risposte “più ricche e contestuali” a ogni prompt, integrando testo e immagini. Gli utenti possono cambiare lo sfondo delle immagini, sostituire oggetti, aggiungere elementi e molto altro, direttamente all’interno di Gemini.
Esempi pratici di utilizzo
Google spiega le potenzialità del nuovo strumento con esempi concreti. Gli utenti possono caricare una foto personale e chiedere a Gemini di generare un’immagine che li ritragga con colori di capelli diversi. Oppure possono chiedere a Gemini di creare una bozza di una storia della buonanotte sui draghi, completa di immagini che accompagnano il testo.
Queste funzionalità potrebbero sollevare preoccupazioni legate ai deepfake. Per fugare questi timori, Google ha annunciato che le immagini create o modificate con Gemini includeranno un watermark invisibile. L’azienda sta anche sperimentando watermark visibili su tutte le immagini generate da Gemini.
La competizione con ChatGPT
L’editor nativo di immagini di Gemini sembra una risposta allo strumento di editing delle immagini recentemente potenziato di ChatGPT. Entrambi ora permettono di non solo generare immagini, ma anche modificarle in modo semplice e flessibile.
La differenza rispetto ai classici generatori di immagini (come quelli che creano solo da prompt testuali) è importante: qui l’utente può intervenire su immagini esistenti, ad esempio ritagliando, aggiungendo oggetti o cambiando lo sfondo, ottenendo risultati più personalizzati e precisi.