Microsoft lancia Azure AI Speech, l'AI che riproduce la voce

Microsoft lancia Azure AI Speech, l'AI che riproduce la voce

Microsoft ha presentato Azure AI Speech, uno strumento AI in grado di riprodurre la voce di chiunque a partire da un breve campione audio.
Microsoft lancia Azure AI Speech, l'AI che riproduce la voce
Microsoft ha presentato Azure AI Speech, uno strumento AI in grado di riprodurre la voce di chiunque a partire da un breve campione audio.

Grazie al massiccio investimento in OpenAI, Microsoft si è posizionata come uno dei leader nel campo dell’intelligenza artificiale. L’azienda di Redmond sta integrando la tecnologia in tutti i suoi prodotti di punta e ampliando la sua offerta cloud con strumenti basati sull’AI.

Questa strategia si sta rivelando vincente, portando Microsoft al primo posto tra le aziende di maggior valore al mondo, superando persino Apple. Con Azure AI Speech, l’azienda sta dimostrando l’intera gamma di possibilità offerte dall’intelligenza artificiale.

Come funziona Azure AI Speech

Azure AI Speech, presentata da Microsoft nel 2023, è uno strumento che permette agli utenti di creare e utilizzare una voce sintetizzata personalizzata all’interno di applicazioni sviluppate dai clienti di Microsoft. Funziona così: se un’app è stata progettata per interfacciarsi con Azure AI Speech, gli utenti potranno fornire un breve campione audio della propria voce reale. Il servizio AI analizzerà le caratteristiche vocali uniche di quella persona e genererà una voce sintetica basata su quel modello.

Successivamente, quando l’utente utilizzerà quell’app abilitata per Azure AI Speech, tutto il testo inserito verrà letto utilizzando la voce artificiale personalizzata creata in precedenza. In questo modo ogni persona può avere una voce AI realistica e personalizzata all’interno delle applicazioni supportate.

Le prime partnership di Microsoft

Questa funzionalità apre le porte a un’ampia gamma di utilizzi. Microsoft ha anche avviato le prime partnership, ad esempio con Truecaller, un’applicazione americana per identificare e bloccare le chiamate indesiderate. L’intelligenza artificiale risponderà alle chiamate potenzialmente spam, interrogando l’interlocutore con la voce dell’utente per determinare se si tratta effettivamente di una conversazione indesiderata.

Skype, invece, sfrutterà lo strumento per la traduzione istantanea e in tempo reale: se si parla con qualcuno che non conosce la propria lingua, l’AI tradurrà automaticamente ciò che si dice nella lingua dell’interlocutore, riproducendo la voce esattamente come è stata pronunciata.

Anche Wondershare, un’applicazione dedicata alla creatività, ha integrato lo strumento di Microsoft, consentendo ai suoi utenti di riprodurre la propria voce in diverse lingue o di commentare i video.

Una tecnologia pericolosa, e Microsoft lo sa

Microsoft offre la possibilità di testare Azure AI Speech, ma richiede un account Azure con una risorsa Speech o Cognitive Services.

Microsoft è consapevole dei rischi legati ad un sistema di sintesi vocale profondamente realistico come Azure AI Speech. Per questo motivo, l’azienda richiede a tutti i clienti che utilizzano il servizio di accettare rigorose politiche sull’utilizzo etico della tecnologia.

In particolare, le policy stabiliscono che è obbligatorio ottenere il consenso esplicito della persona originale prima di creare una voce sintetica basata sulla sua. Inoltre, tutti i contenuti generati tramite la voce AI devono essere chiaramente contrassegnati come creati dall’intelligenza artificiale, in modo da non trarre in inganno chi li ascolta. È assolutamente vietato utilizzare la voce sintetizzata per impersonare qualcuno o per diffondere informazioni false o fuorvianti.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
24 mag 2024
Link copiato negli appunti