AT&T dà voce umana alle macchine

Il gigante USA lavora ad una tecnologia di sintesi vocale che mira a replicare la voce di una persona in tutte le sue sfumature


Menlo Park (USA) – Gli AT&T Labs da anni portano avanti ricerche inerenti alle tecnologie “text-to-speech”, ricerche che oggi fanno intravedere all’orizzonte una possibilità che potrebbe dar vita ad un nuovo e gigantesco business legato alla sintesi vocale: clonare in modo verosimile la voce umana.

Ciò che esalta maggiormente i potenziali clienti di questa tecnologia è la possibilità di poter riportare in vita la voce di celebrità da lungo tempo scomparse, come quelle di cantanti, showman, cronisti o uomini di stato.

Sebbene ad oggi questo non sia ancora del tutto possibile, il software che più si avvicina a risultati di questo tipo è Natural Voices sviluppato dagli AT&T Labs. Il prodotto, già testato in diverse situazioni reali, è in grado di riprodurre la voce di una persona imitandone le inflessioni e gli accenti. Nonostante che l’attuale tecnologia ancora non permetta di ottenere risultati ottimali, e sia dunque ancora possibile distinguere nella voce sintetica quei timbri metallici e quelle tonalità robotiche tipiche della sintesi vocale, i risultati sembrano aver già entusiasmato un buon numero di tester.

I potenziali clienti di Natural Voices sono soprattutto da ricercarsi nei call center, nelle stazioni radiofoniche e nei produttori di dispositivi in grado di interagire vocalmente con l’utente.

Sebbene il riportare in vita voci di celebrità ormai scomparse abbia eccitato la fantasia di molti, soprattutto di chi già traduce tutto questo in dollari sonanti, altri hanno sollevato la delicata questione su chi detenga i diritti di sfruttamento della voce di una celebrità. Forse i prossimi contratti prevederanno una clausola specifica…

Per il momento, come si è detto, la voce della macchina può ancora essere ben distinta da quella umana, ma che succederà quando, con un semplice computer, sarà possibile clonare alla perfezione la voce di chiunque? A questa domanda gli scienziati di AT&T rispondono che per riprodurre la voce di una persona è necessario che questa si sottoponga a lunghe sessioni di dettatura, della durata di 10-40 ore, in uno studio di registrazione ed in presenza di personale tecnico che sappia poi convertire il tutto in dati assimilabili dal motore di sintesi vocale di Natural Voices: un’operazione alla portata di pochissime persone.

Una dimostrazione della tecnologia di Natural Voices è disponibile qui , dove si possono scaricare alcuni file audio prodotti dal nuovo motore di sintesi vocale degli AT&T Labs.

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicato. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy

  • Anonimo scrive:
    Unix non è real-time! Ecos SI
    da red hat:eCos provides the basic runtime infrastructure necessary to support devices with memory footprints in the 10's to 100's of kilobytes, or with real-time requirementsL'articolo si è concentrato sulla ristrettezza degli spazi di memoria ma il motivo più importante è che le applicazionu UMTS come altre applicazioni embedded richiedono un sistema operativo REAL-TIME!!! E LINUX (UNIX) non è un sistema operativo real time. Nel Real-Time la superiorità di altri OS come win, poket pc, eCos, ecc. è schiacciante.
    • Anonimo scrive:
      Re: Unix non è real-time! Ecos SI
      - Scritto da: Ginko
      da red hat:
      eCos provides the basic runtime
      infrastructure necessary to support devices
      with memory footprints in the 10's to 100's
      of kilobytes, or with real-time requirements E vai, un altro sistema operativo nuovo...Speriamo bene, ci guarderemo anche questo.
      L'articolo si è concentrato sulla
      ristrettezza degli spazi di memoria ma il
      motivo più importante è che le applicazionu
      UMTS come altre applicazioni embedded
      richiedono un sistema operativo REAL-TIME!!!
      E LINUX (UNIX) non è un sistema operativo
      real time. Nel Real-Time la superiorità di
      altri OS come win, poket pc, eCos, ecc. è
      schiacciante.Il discorso del realtime in un computer e' un po' piu' complicato di cosi'....Ti consiglio una lettura :http://www.realtime-info.be/encyc/buyersguide/rtos/windowsnt.htmPer una bella analisi del realtime di WinNT, che naturalmente riguarda anche 2000.Questa invece e' la patch per rendere realtime il kernel di linux, penso la provero' poi vi sapro' dire.http://realtimelinux.org/archives/realtime/20009/0000.htmlTra l'altro e' stata scritta da un italiano :)
      • Anonimo scrive:
        Re: Unix non è real-time! Ecos SI
        E poi ci sono vari gradi di real-time.C'e' quello normale dove basta garantire un certo ritardo massimo nella risposta, e c'e' quello spinto con ritardi alla risposta praticamente a valore zero, solo questi ultimi richiedono sistemi operativi costruiti apposta.
    • Anonimo scrive:
      Re: Unix non è real-time! Ecos SI
      Se mi dici QNX ti dico di si, il real time dei sistemi microsoft e' poco piu' real time dei quella di UNIX, che ormai e' soft-realtime da parecchi anni.Ciao
    • Anonimo scrive:
      Unix/Posix è realtime ed anche Linux
      - Scritto da: Ginko
      Nel Real-Time la superiorità di
      altri OS come win, poket pc, eCos, ecc. è
      schiacciante.Un pò di real time con linux:http://www.aero.polimi.it/projects/rtai/http://www.ittc.ku.edu/kurt/http://www.rtlinux.org/http://linux.ece.uci.edu/RED-Linux/http://www.lineo.com/products/embedix_realtime/index.html
Chiudi i commenti