Arriva Eleven Multilingual, modello IA per sintesi vocale in più lingue

Arriva Eleven Multilingual, modello IA per sintesi vocale in più lingue

Eleven Multilingual v1 è un nuovo modello di sintesi vocale potenziato da IA: funziona con più lingue e opera grazie al deep learning.
Arriva Eleven Multilingual, modello IA per sintesi vocale in più lingue
Eleven Multilingual v1 è un nuovo modello di sintesi vocale potenziato da IA: funziona con più lingue e opera grazie al deep learning.

Ormai sul mercato ogni giorno arriva un sito differente con feature potenziate dall’intelligenza artificiale. Recentemente siamo andati alla scoperta di Linkdelta, IA 100% italiana che si focalizza su marketing e SEO. Oggi, invece, parliamo di Eleven Multilingual, un modello avanzato di sintesi vocale che supporta molteplici lingue per comprendere le sfumature testuali di un input e offrire una performance ricca di emozioni, facilitando il lavoro dei creator e non solo.

Alla scoperta di Eleven Multilingual

Proprio in queste ore è arrivato l’annuncio del lancio di Eleven Multilingual v1, modello inedito che supporta la sintesi vocale in francese, tedesco, hindi, italiano, polacco, portoghese e spagnolo, oltre ovviamente all’inglese. Come il predecessore, si rivela un eccellente strumento di narrazione, capace di adattare qualsiasi testo a contesti differenti, e di trasmettere intenti ed emozioni in modo iperrealistico.

Un’abilità particolare di questo modello è la capacità di identificare il testo multilingue e di articolarlo in modo appropriato, generando discorsi in più lingue con lo stesso prompt, ottenendo voci dalle caratteristiche uniche. Per ottenere i migliori risultati, però, rimane consigliabile l’uso con una singola lingua. Il progetto di ElevenLabs non è comunque esente da difetti: numeri, acronimi e parole straniere, ad esempio, a volte vengono impostati automaticamente in inglese. O ancora, l’IA genera un dialogo continuo, con poche pause corrispondenti a quelle che un essere umano potrebbe fare nel parlato normale.

L’obiettivo è però evidente e lodevole: rendere tutti i contenuti universalmente accessibili in qualsiasi lingua e con qualsiasi voce, con un singolo modello Text-to-Speech (TTS) che possa operare correttamente con qualsiasi voce IA di alta qualità, estremamente simile a una controparte umana. Insomma, l’intelligenza artificiale di Eleven Multilingual, in questo modo, può davvero colmare le lacune culturali e promuovere la comprensione globale.

Da un lato, i creator possono interagire con una fetta di pubblico più grande, mentre sviluppatori e editori di videogiochi possono creare esperienze coinvolgenti e localizzate per un pubblico internazionale, trascendendo le barriere linguistiche.

Il nuovo modello è disponibile con diversi piani di abbonamento, ma è possibile provarlo gratuitamente sulla piattaforma Beta, per un massimo di 10.000 caratteri al mese.

Fonte: Eleven Labs
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
28 apr 2023
Link copiato negli appunti