Google, riconoscimento vocale open source per le IA

Anche Mountain View pubblica un dataset di registrazioni vocali, sia per agevolare la creazione di IA, sia per pubblicizzare il proprio framework TensorFlow
Anche Mountain View pubblica un dataset di registrazioni vocali, sia per agevolare la creazione di IA, sia per pubblicizzare il proprio framework TensorFlow

Dopo Mozilla Foundation, che ha rilasciato il progetto Common Voice il mese scorso, anche Google ha recentemente dato un suo contributo per la creazione di intelligenze artificiali sempre più efficaci nelle operazioni di riconoscimento vocale ( speech-to-text ).

Con un articolo sul proprio blog , i team di TensorFlow e AIY hanno annunciato la pubblicazione dello Speech Commands Dataset : un dataset, appunto, contenente 65.000 registrazioni vocali di 30 semplici parole, pronunciate da volontari provenienti da tutto il mondo.

Il dataset, disponibile per il download , è stato rilasciato sotto licenza Creative Commons BY 4.0 ; le applicazioni Web ed Android utilizzate per la sua creazione, invece, sono state rilasciate sotto licenza Apache 2.0 , la quale consente, a differenza della prima, di imporre limitazioni all’utilizzo di eventuali versioni modificate.

È possibile contribuire alla crescita del dataset inviando fino a 135 registrazioni, attraverso l’applicazione Web disponibile sul sito di Google AIY .

open speech recording

Sono inoltre disponibili, oltre all’immagine Docker del framework TensorFlow , una serie di applicazioni di esempio che sfruttano le capacità del framework, oltre a dei tutorial per il training dei propri modelli di riconoscimento vocale.

Elia Tufarolo

Fonte Immagine

Link copiato negli appunti

Ti potrebbe interessare

30 08 2017
Link copiato negli appunti