Google Vertex AI: Lyria, Veo 2, Chirp 3 e Imagen 3

Google Vertex AI: Lyria, Veo 2, Chirp 3 e Imagen 3

Google ha aggiunto il nuovo modello Lyria (text-to-music) alla piattaforma Vertex AI e annunciato novità per i modelli Veo 2, Chirp 3 e Imagen 3.
Google Vertex AI: Lyria, Veo 2, Chirp 3 e Imagen 3
Google ha aggiunto il nuovo modello Lyria (text-to-music) alla piattaforma Vertex AI e annunciato novità per i modelli Veo 2, Chirp 3 e Imagen 3.

Google ha annunciato la disponibilità del nuovo modello Lyria per la piattaforma Vertex AI durante l’evento Cloud Next ’25. Sono stati inoltre aggiornati i modelli Veo 2, Chirp 3 e Imagen 3 con nuove interessanti funzionalità. L’azienda di Mountain View ha ricordato inoltre le protezioni implementate per sicurezza, privacy e copyright.

Novità per Vertex AI

La novità principale è Lyria. Si tratta di un modello text-to-music che consente di generare tracce musicali a partire da una descrizione testuale. È sufficiente indicare tutte le caratteristiche del brano, come il tipo di strumenti musicali e il genere, per ottenere un risultato di qualità in pochi minuti. Attualmente è accessibile in anteprima privata.

Google ha annunciato inoltre quattro miglioramenti per Veo 2, il modello di generazione video. È possibile rimuovere immagini di sfondo, loghi e altri oggetti indesiderati dal video. L’utente può anche estendere il frame per ottenere un formato (rapporto di aspetto) adatto per web e dispositivi mobile.

Sono inoltre disponibili varie tecniche cinematiche, come i movimenti della videocamera, l’effetto timelapse e la ripresa da un drone. Infine, il modello può generare un video interpolato a partire dai frame iniziale e finale.

Chirp 3 è il modello di generazione vocale che supporta 35 lingue. Google ha aggiunto due funzionalità. Instant Custom Voice consente di generare una voce realistica a partire da 10 secondi di input audio. Transcription with Diarization permette invece di individuare gli speaker in una registrazione e migliorare la trascrizione della conversazione.

Imagen 3 è infine il modello text-to-image. Google ha migliorato la generazione delle immagini con la funzionalità che consente di rimuovere gli oggetti e aggiungere le parti mancanti.

Tutti i modelli usano il digital watermark SynthID che indica l’uso dell’intelligenza artificiale. Sono inoltre presenti filtri che impediscono la generazione di contenuti vietati. Google non usa i dati degli utenti per addestrare i modelli e rispetta il copyright.

Fonte: Google
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
9 apr 2025
Link copiato negli appunti