Le novità nell’ambito dell’IA generativa si susseguono in modo frenetico: tra quelle più recenti e degne di nota, vale la pena citare DragGAN, un modello in grado di intervenire sulle immagini con modalità simili a quelle dello strumento Altera incluso in Photoshop. L’intelligenza artificiale non si limita a eseguire un fotoritocco, ma va oltre, creando (e ricreando) le porzioni mancanti. È anche possibile ruotare i soggetti come fossero inclusi in scenari 3D.

Come Altera di Photoshop, ma con l’IA generativa: DragGAN

Il nome è già di per sé piuttosto esplicativo per comprenderne la natura, il funzionamento e le finalità. L’utente non deve far altro che selezionare un dettaglio e trascinarlo con il cursore. Una dimostrazione, utile per capire meglio di cosa si tratta, è inclusa nel filmato (accelerato) qui sotto: partendo dalla fotografia di un cane, ad esempio, in pochi secondi è possibile fargli sollevare le orecchie, aprire la bocca o farlo sedere. Lo stesso vale per un gatto o un cavallo e per qualsiasi altro animale. La tecnica può essere applicata anche a panorami e volti umani.

Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold paper page: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA — AK (@_akhaliq) May 19, 2023

Tutti i dettagli a proposito di DragGAN sono consultabili all’interno di un documento di ricerca dedicato (PDF). Al momento, il modello è fermo allo status di demo e non ancora pubblicamente accessibile. Non sono state fornite tempistiche a proposito di un eventuale lancio.

I suoi autori pongono l’attenzione su un dettaglio non scontato. L’intelligenza artificiale in questione, oltre che per le abilità appena descritte, potrebbe tornare particolarmente utile quando c’è bisogno di intervenire sulle immagini create attraverso gli strumenti di IA generativa, come Midjourney appunto. Ad esempio, chiedendo a un modello di dar vita a un leone che corre in una savana, questo eseguirà il compito e il risultato sarà fotorealistico, ma la sua posizione e direzione potrebbe non essere esattamente quella desiderata.