Un motore di ricerca più intelligente

Un motore di ricerca più intelligente

di Luca Spinelli - Un search engine può rispondere a domande comuni attingendo dall'immenso database di Wikipedia. Per ora le risposte le fornisce solo in inglese. Ma è una beta, ed è (quasi) tutta italiana
di Luca Spinelli - Un search engine può rispondere a domande comuni attingendo dall'immenso database di Wikipedia. Per ora le risposte le fornisce solo in inglese. Ma è una beta, ed è (quasi) tutta italiana

Milano – Secondo l’annuncio dato ieri dalla Expert System , quello che da sempre è stato uno dei talloni d’Achille della maggiore enciclopedia al mondo – ma non solo suo – potrebbe finalmente essere superato. Dalla collaborazione fra l’azienda italiana, la californiana AskMeNow , e la Wikimedia Foundation , nasce il primo motore di ricerca basato sul linguaggio naturale, specifico per i contenuti di Wikipedia.

AskWiki , questo il nome, si basa sulla tecnologia tutta italiana di Cogito , già utilizzata da Microsoft, Vodafone, Pirelli ed altre importanti aziende internazionali. Il motore, attualmente in versione beta disponibile solo in inglese, è già in grado di rispondere a domande formulate in linguaggio comune, come: ” what is the capital of Italy? “, ” what is the population of Genova? “, ma anche a interrogativi più complessi come ” do really cats eat mice? ” (“i gatti mangiano davvero i topi?”) o ” is Punto Informatico an italian newspaper? ” (“Punto Informatico è un quotidiano italiano?”), fino alle tipiche domande che soddisfano l’internettiano più incancrenito come “was Hitler a homosexual?” (“Hitler era omosessuale?”), o “Was Jessica Alba nude in anything?” (“Jessica Alba si è mai mostrata nuda?”).

Ponendo domande come queste – in linguaggio comune – il sistema recupera solamente i contenuti opportuni dai testi dell’enciclopedia precedentemente indicizzati e analizzati. L’indice dei contenuti di AskWiki, infatti, costituisce una vera e propria mappa concettuale: contiene i concetti con i relativi significati, e di conseguenza le relazioni di senso fra tutte le voci di Wikipedia. Quando un utente pone una domanda, il sistema identifica qual è l’informazione cercata e la va ad estrarre dalla mappa concettuale.

Il grado di accuratezza, inoltre, sarà costantemente incrementato sia grazie alle valutazioni degli utenti sulle risposte ricevute, sia soprattutto sfruttando le capacità di auto apprendimento del software. La rete semantica e il thesaurus alla base della tecnologia di Cogito, infatti, individueranno nel tempo nuove relazioni di senso fra i termini cercati e le informazioni da reperire nell’immensa enciclopedia online. AskWiki, si pone quindi l’ambizioso intento di unire le potenzialità di uno dei più grandi depositi di informazione al mondo, con quelle della ricerca “intelligente”.

Dato che l’utente medio di un motore di ricerca spende circa il 95% del tempo nel cercare fra i link e meno del 5% nello scegliere le parole chiave più adatte (perdendo di conseguenza un sacco di tempo), la strada intrapresa da AskWiki risponde a questo comportamento senza cercare di modificarlo inutilmente, ma assecondandolo.

Ma se progetti simili esistono da decine di anni (fin da Turing , ELIZA e in parte anche Google), questo è probabilmente di uno dei primi casi nella storia in cui l’analisi semantico – lessicale viene applicata ad una mole di informazioni così imponente, dinamica e pubblica. Le prospettive più immediate di questo progetto sono quelle di permettere un accesso più semplice e approfondito alla conoscenza presente su Wikipedia, ma si fa anche un importante passo avanti verso l’analisi semantica dell’intera Rete e della conoscenza, affrontando la sfida del cosiddetto Web Semantico sotto una prospettiva spesso trascurata anche dai suoi stessi ideatori.

Il ” Semantic-Web ” come concepito dai suoi padri, infatti, è rallentato principalmente della difficoltà di diffusione dei nuovi linguaggi di marcatura, spesso complessi e poco duttili. Analizzando il senso delle domande e delle frasi, si supera direttamente questa difficoltà usando un approccio differente: quello dell’analisi della lingua, che contiene nativamente in sé infiniti “tag grammaticali” (le regole) e ontologici .

Le risorse da impegnare per rendere AskWiki un prodotto in grado di influenzare realmente il Web sono certamente molte e complesse, come è assai complesso prevedere se un progetto simile attirerà realmente l’interesse degli utenti, vista l’agguerrita concorrenza.
Ma le prospettive d’ampio respiro alle spalle dell’idea “AskWiki” sono immense e quantomeno affascinanti, poiché coinvolgono i più vari ambiti: dall’economia, al marketing, fino a quelli più generali dell’intelligenza artificiale e della conoscenza.

Luca Spinelli
www.lucaspinelli.com

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
23 nov 2007
Link copiato negli appunti