Tu parla, così IBM ti vede

Tu parla, così IBM ti vede

Big Blue sta lavorando a prodotti per il riconoscimento vocale che non si limiteranno a capire le parole. Le interpreteranno
Big Blue sta lavorando a prodotti per il riconoscimento vocale che non si limiteranno a capire le parole. Le interpreteranno


Armonk (USA) – Big Blue è una delle aziende che ha investito di più nel passato nelle tecnologie di riconoscimento vocale, detenendo un bagaglio di brevetti che oggi le danno la possibilità di puntare su quelli che chiama “conversational services”.

Fra i prodotti più interessanti che vedranno la luce nei prossimi due anni c’è n’è uno che si avvale del “riconoscimento visuale”, un sistema che è capace, attraverso una telecamera, di avvalersi del movimento delle labbra e della bocca per capire lo stato d’animo ed interpretare la mimica facciale di chi sta parlando.

“La faccia trasmette messaggi, felicità, tristezza, collera. La sfida è come modellare tutto questo ed integrarlo sopra alle altre tecnologie vocali”, ha detto David Nahamoo, senior manager di IBM.

Questa tecnologia potrebbe interessare in special modo le interfacce di comunicazione fra aziende e clienti, come i call center, dove sarà possibile verificare lo stato d’animo dei clienti ed interpretare le loro esigenze. O “carpirle”….

Secondo Nahamoo, grazie a questo sistema sarà anche possibile creare software di che disattivino il canale audio non appena il viso della persona che parla non viene più inquadrata dalla telecamera o che filtrino eventuali voci estranee riconoscendole grazie alla possibilità, attraverso le labbra, di verificare se l’utente stia effettivamente parlando.

Quest’ultima funzionalità può tornare molto comoda in ambienti rumorosi, dove voci estranee ed altri rumori possono interferire con la conversazione dell’utente: per il momento la tecnologia di IBM è in grado di mantenersi efficace, con dizionari limitati, fino a 10 dB di rumore ambiente.

Un altro prodotto interessante mostrato di recente dai laboratori di IBM è un piccolo add-on per Palm in grado di aggiungere a questi noti hand held funzionalità di speech-to-text, una tecnologia utile soprattutto per comandare vocalmente applicazioni come la rubrica e il calendario, oppure per la composizione di numeri telefonici (una funzione che prevede l’interazione, via Bluetooth, con i telefoni cellulari).

Lo scorso mese IBM ha anche introdotto il WebSphere Translation Server, un sistema in grado di tradurre circa 500 parole al secondo in modo bi-direzionale fra varie lingue, fra cui inglese, tedesco, spagnolo, francese e italiano.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
26 giu 2001
Link copiato negli appunti