Stability AI svela Stable Audio, nuova IA per convertire testi in audio

Stability AI svela Stable Audio, nuova IA per convertire testi in audio

Stability AI ha svelato Stable Audio, nuova IA generativa per la creazione di file sonori da semplici descrizioni testuali, ed è gratuita!
Stability AI svela Stable Audio, nuova IA per convertire testi in audio
Stability AI ha svelato Stable Audio, nuova IA generativa per la creazione di file sonori da semplici descrizioni testuali, ed è gratuita!

In seguito al rilascio di Stable Animation SDK, strumento text-to-animation firmato Stability AI che supporta artisti e sviluppatori generando animazioni speciali con l’IA, la società porta i suoi algoritmi di IA generativa nel mondo della musica con il motore di conversione testo-audio Stable Audio. Si tratta di una soluzione analoga a Stable Diffusion, focalizzata però su file sonori. Vediamo come funziona e come sarà disponibile per gli utenti di tutto il mondo.

Stability AI lancia Stable Audio: come funziona?

In occasione dell’annuncio, l’azienda ha spiegato che l’intelligenza artificiale Stable Audio è stata addestrata con la libreria musicale online AudioSparx, e che con tali file riesce addirittura a realizzare musica di alta qualità a 44,1 kHz per uso commerciale. Bastano pochi input per ottenere un campione della durata di 45 secondi, utilizzando descrizioni dettagliate per ottenere il miglior output possibile a seconda delle personali necessità.

Ad esempio, è possibile realizzare brani lounge con descrizioni come “Trance, Ibiza, Beach, Sun, 4 AM, Progressive, Synthesizer, 909, Dramatic Chords, Choir, Euphoric, Nostalgic, Dynamic, Flowing”, o passare a brani garage rock, orchestrali e di molti altri generi.

Stable Audio Stability AI

La versione gratuita consente però di generare e scaricare solo 20 tracce individuali al mese, ed è valida esclusivamente per un utilizzo non commerciale. Per quest’ultimo è necessario iscriversi al piano Stable Audio Professional da 12 dollari al mese, con 500 brani mensili dalla durata massima di 90 secondi. Il piano Enterprise, invece, consente di personalizzare la durata dell’audio e accedere a molte più generazioni di canzoni; è richiesto però un contatto diretti con Stability AI per impostare il piano.

Bisogna oltretutto considerare che Stable Audio genera esclusivamente brani strumentali, e spesso può realizzare file audio poco convincenti a seconda del genere richiesto. Insomma, si tratta di una base interessante che Stability AI dovrà perfezionare nel corso dei prossimi mesi.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
14 set 2023
Link copiato negli appunti