TikTok ha annunciato una funzionalità che permette di generare immagini a partire dal testo digitato dagli utenti. Il “text-to-image generator” sfrutta l’intelligenza artificiale per consentire la creazione di sfondi per i video del famoso social network. Le immagini risultanti non raggiungono però il livello di dettaglio offerto da sistemi più avanzati, come DALL-E e DALL-E mini (Craiyon).

Immagini dal testo con alcune limitazioni

L’effetto aggiunto da TikTok, denominato “AI greenscreen“, è disponibile nelle app per Android e iOS. Gli utenti devono inserire il testo nella schermata della fotocamera per ottenere immagini astratte e swirling. È possibile anche sfruttare i suggerimenti proposti, ad esempio “astronaut in the ocean” o “flower galaxy“. Modelli più complessi, come quelli di DALL-E 2 di OpenAI o Imagen di Google generano invece immagini fotorealistiche e complesse.

Probabilmente le limitazioni del modello di TikTok sono intenzionali. Innanzitutto, i modelli più avanzati richiedono una maggiore potenza di calcolo. Ma quasi certamente il motivo principale è dovuto al tipo di immagini che potrebbero essere generate.

Quando l’utente scrive un testo riferito a nudità o violenza (ad esempio “nude wowan on beach” o “man with a gun“), l’intelligenza artificiale mostra immagini con i colori appropriati, ma senza i contenuti che possono violare le linee guida della piattaforma.