Si chiama THESEUS: come l’omonimo eroe mitologico riuscì a vincere il labirinto di Cnosso , il progetto volto alla realizzazione di una nuova infrastruttura della conoscenza con base permanente online, mira a districare la matassa di informazioni grezze grazie al filo della tecnologia di correlazione semantica dei metadati.
Avviato dal Ministero Federale tedesco dell’Economia e della Tecnologia, THESEUS va oltre servizi quali Twine e trae vantaggio dalla possibilità, grazie alla semantica, di identificare i contenuti (parole, immagini, suoni) e il loro significato, classificarli e metterli in relazione l’uno con l’altro. Si tratta di un progetto di ampio respiro , coordinato dal Heinrich Hertz Institute (HHI) del Fraunhofer-Institute for Telecommunications e a cui partecipano nove diversi istituti Fraunhofer, 31 società, università e istituti di ricerca tedeschi.
I ricercatori coinvolti ambiscono alla realizzazione di tecnologie seminali per una Internet ben oltre il social networking, il web 2.0 e il meme del cloud computing, una Internet che non esiste ancora ma a cui si dovrà necessariamente dare corpo per permettere ai netizen di domani di accedere alla matassa labirintica della conoscenza interconnessa, avendo a disposizione un filo salvifico che indichi la via da seguire.
Presso l’HHI stanno provando a realizzare le tecnologie base di THESEUS, quelle che dovranno occuparsi dell’identificazione dei contenuti e della loro classificazione secondo principi di analisi semantica. Ma non solo, gli algoritmi in via di sviluppo all’HHI dovranno occuparsi anche di recuperare e “restaurare” i contenuti digitali , siano essi testuali o visivi, restituendoli al loro originale e scremandoli ad esempio da pagine ingiallite dal tempo.
Tali algoritmi saranno in grado, impiegando nuovi procedimenti di analisi della qualità, di riconoscere tali difetti, fornendo dunque le basi per la restaurazione digitale delle informazioni e la successiva classificazione semantica. Utilizzando tale tipo di analisi, inoltre, il procedimento di ricerca tra video e foto, attualmente molto laborioso, verrà semplificato e velocizzato grazie all’impiego dei metadati generati automaticamente a partire dai dati presi in esame.
Un sistema di classificazione semantica potrebbe ad esempio estrapolare le forme e i contenuti di una fotografia o di un’immagine, un albero, una sedia, il sole, codificando il risultato di tali estrapolazioni all’interno del contenuto stesso. In attesa della realizzazione di un motore di ricerca in grado di lavorare pienamente con i metadati, dicono i ricercatori, è necessario che il processo di estrapolazione e codifica divenga uno standard già adesso per preparare, oggi, i contenuti della Internet del futuro .
E poi si parla ancora di valutazione statistica automatizzata dei referti medici e delle immagini delle TAC, un campo di applicazione in cui la velocità di esecuzione delle analisi computerizzate potrebbe permettere di confrontare, a velocità particolarmente alte, i referti di un paziente con quelli di altri, aiutando in tal modo il medico a scrivere una diagnosi. THESEUS e le relative tecnologie verranno presentate, in anteprima, al CeBIT di Hannover che si tiene in questi giorni.
Alfonso Maruccia