Per individuare un filmato bastano i fonemi

Per individuare un filmato bastano i fonemi

Nexidia ha realizzato un motore di ricerca capace di semplificare l'individuazione di contenuti audio-video: si basa sui fonemi invece che sull'analisi di tag testuali e allegati descrittivi
Nexidia ha realizzato un motore di ricerca capace di semplificare l'individuazione di contenuti audio-video: si basa sui fonemi invece che sull'analisi di tag testuali e allegati descrittivi

Il motore di ricerca basato su fonemi è probabilmente una delle più interessanti novità applicate al campo multimediale. Nexidia sta lavorando su questo fronte e ha annunciato lo sviluppo di un sistema di ricerca che permette di individuare termini e frasi presenti nei contenuti audio/video. I tecnici si sono concentrati nell’indicizzazione di fonemi, creando di fatto una matrice di riconoscimento che a loro dire è applicabile ad ogni tipo di file multimediale.

Le soluzioni tradizionali si affidano, di solito, o alla trascrizione completa dell’audio o all’utilizzo di allegati descrittivi dei contenuti. Il problema, però, è che nelle piattaforme di sharing più diffuse l’individuazione di un file è strettamente legata all’operato degli utenti e alla loro capacità di nominazione e descrizione dei contenuti uplodati. La questione si complica ulteriormente se si ha bisogno di ottenere un’informazione precisa, magari presente in un reportage giornalistico. Insomma, una ricerca testuale all’interno di un archivio multimediale è destinata a diventare sempre più complicata. Con migliaia di filmati o podcast disponibili online, un motore a fonema potrebbe dimostrarsi l’unica soluzione vincente per non perdere tempo.

Nexidia, al momento, vanta collaborazioni in ambito business e governativo. Gli utenti possono però testare le capacità di questa soluzione accedendo al nuovo motore di ricerca VideoNow utilizzato dal canale statunitense WXIA Channel 11 . Il sito web ufficiale dispone di una stringa testuale di ricerca che permette di individuare ogni termine, digitato, all’interno dell’archivio video giornalistico. Si può procedere sia con l’inserimento di parole che con la loro trascrizione fonologica, in questo caso inglese. I risultati, sebbene si tratti di una Beta del servizio, sembrano più che soddisfacenti. Si ottiene in pochi secondi l’elenco dei servizi giornalistici dove è presente il termine ricercato.

Una versione multilingua, dicono gli sviluppatori, è decisamente a portata di mano se si considera che ogni idioma condivide almeno 40 fonemi e che al massimo ne utilizza univocamente 400. La documentazione pubblicata sul sito ufficiale da Nexidia lascia spazio all’immaginazione e alle applicazioni future. Domani, gestire il proprio archivio musicale su un lettore MP3 potrebbe diventare solo una questione di pronuncia, più che di manualità.

Dario d’Elia

Link copiato negli appunti

Ti potrebbe interessare

12 10 2006
Link copiato negli appunti