Stability AI annuncia Stable Audio 2.0

Stability AI annuncia Stable Audio 2.0

Stable Audio 2.0 è la nuova versione del modello text-to-audio che permette di generare brani musicali di 3 minuti a partire da un prompt testuale.
Stability AI annuncia Stable Audio 2.0
Stable Audio 2.0 è la nuova versione del modello text-to-audio che permette di generare brani musicali di 3 minuti a partire da un prompt testuale.

Stability AI ha annunciato Stable Audio 2.0, la seconda versione del modello che permette di generare un brano musicale a partire da un prompt testuale e un campione audio. Rispetto alla prima generazione ci sono diversi miglioramenti, tra cui la maggiore lunghezza della clip finale. Può essere utilizzato gratuitamente sul sito ufficiale.

Brani musicali di tre minuti

La versione 1.0, annunciata a settembre 2023, consentiva di generare brani musicali con lunghezza massima di 90 secondi, sottoscrivendo l’abbonamento Professional (45 secondi senza abbonamento). Stable Audio 2.0 offre invece la possibilità di generare clip con lunghezza massima di 3 minuti a tutti.

L’utente deve solo inserire un prompt testuale che descrive il genere musicale e altre caratteristiche. Il modello text-to-audio genererà un brano stereo a 44,1 kHz. La lunghezza di 3 minuti consente di ottenere una composizione strutturata con intro, progressione e outro. È possibile anche aggiungere effetti audio. Sul sito dedicato ci sono alcuni esempi. Per usare il tool gratuito è necessaria la registrazione.

Stable Audio 2.0 supporta anche l’upload di un campione che verrà usato come riferimento in aggiunta al prompt testuale. Stability AI avverte però che l’audio non deve essere protetto dal diritto d’autore. Un avanzato sistema di riconoscimento rileverà eventuali violazioni del copyright.

L’addestramento del nuovo modello viene effettuato con oltre 800.000 file audio (musica, effetti sonori, singoli strumenti) di AudioSparx. Gli artisti possono eventualmente negare l’uso del proprio materiale (opt out). In futuro verranno rilasciate le API Stable Audio. Su YouTube è disponibile la Stable Radio che trasmette le tracce generate con Stable Audio.

A fine marzo, il fondatore e CEO di Stability AI (Emad Mostaque) ha annunciato le dimissioni. In base alle ultime indiscrezioni, l’addio sarebbe dovuto anche all’incapacità di trovare nuovi finanziamenti. I costi per l’addestramento dei modelli sono molto superiori alle entrate. L’azienda non avrebbe pagato diverse fatture a AWS, Google Cloud e CoreWeave.

Fonte: Stability AI
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
3 apr 2024
Link copiato negli appunti