Trovare le parole e le foto giuste

Contare quante volte un vocabolo è ripetuto non basta. Occorre anche capire dove e come avviene la reiterazione. Uno studio spagnolo potrebbe dare una mano al web, mentre Yahoo! aggiorna il suo sistema di ricerca delle immagini

Roma – Studiare un testo come fosse un sistema quantistico applicando tecniche di analisi matematiche: basta contare le parole per estrapolare concetti interessanti, per sintetizzare il contenuto e i concetti chiave di uno scritto. È quanto è riuscito a Pedro Carpena , fisico dell’Università di Malaga, che ha applicato le sue teorie a testi di ogni tipo: scovando di volta in volta le parole chiave dell’argomento trattato, e gettando le basi per un nuovo tipo di classificazione dei testi.

Un po’ come succede con Google, che giudica la rilevanza di un sito in base alle relazioni che intesse con il resto del Web, Carpena ha cercato un modo per pesare una parola (keyword) all’interno di un testo: partendo dal presupposto che già la semplice ripetizione di un vocabolo potesse di per sé costituire un indice di rilevanza, ha poi aggiunto un criterio basato sulla prossimità della ripetizione.

Un concetto fondamentale per un saggio o una teoria scientifica secondo Carpena richiede l’utilizzo di termini specifici, più volte ripetuti nel giro di poche righe o poche pagine per estrinsecare al meglio il pensiero dell’autore. Non è soltanto la ripetizione che conta, ma pure la posizione in cui le parole vengono disposte: il risultato degli esperimenti, condotti su un campionario multilingua comprendente inglese, spagnolo, latino, tedesco e italiano , è sembrato incoraggiante.

Sia che si tratti di Darwin che discetta delle origini delle specie che di Einstein che spiega la Relatività, oppure che sia il turno di Dante di condurre in un viaggio che parte dall’inferno ed arriva in paradiso, la tecnica delle matrici casuali applicata da Carpena ottiene buoni risultati: i concetti chiave, i nomi dei personaggi più presenti, tutti vengono correttamente identificati e posti in evidenza. Un meccanismo potenzialmente utile anche per rivedere con maggiore cognizione di causa i database dei motori di ricerca su web , che acquisirebbero per così dire un pizzico di giudizio semantico in più.

Carpena ha anche applicato la sua teoria agli stessi testi analizzati in precedenza, questa volta eliminando tutti gli spazi e facendo eseguire un parsing continuo: istruendo il computer ad andare in cerca di stringhe significative comprese tra 2 e 35 caratteri i risultati sono stati egualmente positivi, segno che probabilmente la sua tecnica potrebbe essere applicata anche ad altre base di dati strutturate in modo differente dal linguaggio umano. Per il momento lo studio sembra non analizzare l’efficienza del metodo: per quella, chiarisce New Scientist saranno necessari ulteriori approfondimenti futuri.

La capacità di scovare i contenuti più appropriati nell’oceano sempre più vasto della conoscenza della Rete è d’altronde uno dei problemi più attuali del search: le sperimentazioni e i primi tentativi di valorizzare il deep web non mancano , ma riuscire a presentare quanto attualmente indicizzato in modo più fruibile sarebbe un obiettivo non da poco. In questa direzione si stanno muovendo Google e pure Microsoft, che lavora dietro le quinte al suo Kumo).

Questa volta però la novità viene da Sunnyvale: Yahoo! ha da poco dato una rinfrescata all’interfaccia della sua ricerca immagini , staccandosi dallo schema adottato anche dalla concorrenza e provando a offrire un’interfaccia più estesa e completa all’utente finale. Cliccando su uno dei risultati proposti si verrà come di consueto condotti sulla pagina che contiene la immagini: ma la barra che di solito viene posta in cima ai contenuti ora è più ampia, contiene un riquadro per ritentare la ricerca con un’altra parola chiave e altri risultati proposti dalla keyword attuale, più le ricerche tipicamente abbinate a quell’argomento. Secondo Yahoo!, ora “la pagina di anteprima vi aiuterà a trovare quello che state cercando, forse anche a scoprire qualcosa di nuovo”: chissà se anche la concorrenza adotterà la stessa soluzione.

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicato. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy

  • Funz scrive:
    Amazon
    Amazon è stata in rosso molti anni prima di generare profitti, ma ce l'ha fatta. Speriamo valga lo stesso per tante altre piattaforme fondamentali per l'Internet di oggi (scempiaggini di CSOE a parte), possibilmente senza infarcire il tutto di spam.
    • Retrogames scrive:
      Re: Amazon
      - Scritto da: Funz
      Amazon è stata in rosso molti anni prima di
      generare profitti, ma ce l'ha fatta.Si, ma Amazon non fa nulla di strano: acquista prodotti è li rivende. E' "old economy", l'unica differenza è il sito web al posto del negozio, ma sempre di aquisto e rivendita prodotti si parla, quello in cui Amazon è riuscita, è diventare abbastanza forte da poter imporre ai fornitori condizioni migliori di altri fino a, eventualmente, sostituirsi agli stessi editori, visto che molti libri sono venduti solo da Amazon.Il caso di YouTube è ben diverso, perchè spende soldi, ma offre prodotti gratuitamente, se e quando la pubblicità potrà coprire le spese, è quantomeno dubbio.Diciamo che, finchè alle spalle c'è Google, YouTube non dovrebbe preoccuparsi. Del resto, la sua ambizione è sostituire la TV commerciale, forse vale la pena andare in perdita per un bel po', avendo questo obiettivo in vista.Quello che mi preoccupa è, visto gli interessi politici che la TV smuove (basta vedere quanto starnazzano i politici quando si tratta di nominare i consigli di amministrazione RAI...), non è che si inventeranno discorsi di copyright e anche non meglio specificate motivazioni di protezioni dei minori (quando qualcuno nomina questo argomento, guardatevi subito nel portafoglio...), come scusa per limitare/censurare YouTube ? Ovviamente, l'obbiettivo vero è EVITARE, appunto, che YouTube sostituisca l'attuale TV
      • sylvaticus scrive:
        Re: Amazon
        condivido
        • Funz scrive:
          Re: Amazon
          - Scritto da: sylvaticus
          condividoAnche io.
          • mik.fp scrive:
            Re: Amazon
            - Scritto da: Funz
            - Scritto da: sylvaticus

            condivido

            Anche io.Mi accodo. Ma non senza aggiungere che quella e' una via forzata ... quindi direi che invece di XXXXXXXrsi/preoccuparsi o, peggio, tentare di mettere in pratica idee idiosincratiche finendo per farsi male e basta per inevitabile assenza di massa critica ... occorre maturare la forza di superare le differenze politiche. Perche' YouTube ha gia' cannibalizzato la produzione A/V italiana nel momento in cui l RAI gliel'ha messa a disposizione, o cmq, nel momento in cui la RAI non la mette a disposizione (gratuitamente, con tecnologie aperte, e senza restrizioni di copyright) del pubblico che l'ha pagata ... altrimenti queste analisi, per quanto condivisibili, non producono benessere alcuno. E direi che n'e' urgentemente bisogno (del benessere).
    • Luca Vincenti scrive:
      Re: Amazon
      Queste piattaforme non sono certo fondamentali per la rete, anzi fregano solo tanta banda praticamente per cazzaggiare e non fare nulla di serio.Non credo Google & c. sopportino a lungo queste enormi perdite...
      • Funz scrive:
        Re: Amazon
        Non condivido per nulla... tutti i siti più interessanti (questo compreso) linkano pesantemente YT e simili per una sacco di cose, mica solo per le gare di rutti...
      • cla scrive:
        Re: Amazon
        Scherzi?????Io ho abbandonato la TV e vedo solo contributi video di youtube ... Cla
      • Ubunto scrive:
        Re: Amazon
        - Scritto da: Luca Vincenti
        Queste piattaforme non sono certo fondamentali
        per la rete, anzi fregano solo tanta banda
        praticamente per cazzaggiare e non fare nulla di
        serio.Dipende dalle prospettive. Dici che non sono fondamentali per la rete, ma a "quale" rete ti riferisci e con quali scopi?Se l'obiettivo è vendere qualcosa a qualcuno, si tratti di un servizio e di un bene materiale, youtube, facebook, &c. sono importanti eccome! Non è necessario che youtube ti venda qualcosa, ma è sufficiente che la faccia vendere agli altri guadagnando a sua volta.
  • CSOE scrive:
    Progetti in perdita
    Quando chiuderanno tutti questi progetti in perdita che drogano il mercato ?FaceBook, Twitter e simila in profondo rosso, che magari neppure sanno come fare i soldi, devono chiudere al più presto.E come ciliegina, potrebbero cominciare a chiedere agli universitari, studenti e professori, rispettivamente di studiare ed insegnare invece di lavorare stipendiati dalla comunità a progetti Open.
    • cla scrive:
      Re: Progetti in perdita
      Mai sentito parlare di Break Even? Se esiste un modello sostenibile di break even o se il progetto è strategico anche in perdita io lo terrei (ovviamente avendo altre fonti di cash positivo).A naso Youtube è strategico ...Cla
      • mik.fp scrive:
        Re: Progetti in perdita
        - Scritto da: cla
        Mai sentito parlare di Break Even? Se esiste un
        modello sostenibile di break even o se il
        progetto è strategico anche in perdita io lo
        terrei (ovviamente avendo altre fonti di cash
        positivo).

        A naso Youtube è strategico ...
        ClaEconomisti ... SE ESISTE, SI ... ma esiste? Oppure - per esempio - ci sono banche che stampano soldini, che prestano allo Zio Sam, il quale ci compra servizi a Google, il quale ci paga (poco) i dipendenti, i quali caricano sulla banconota il "proprio valore" (risorse naturali&lavoro), per poi restituirla alla banca sottoforma di mutuo, la quale decide autonomamente come impiegare la ricchezza ottenuta con questo giochino, senza pero' ritornare un valore distribuito perche' e' una entita' immaginaria subordinata solo ai propri azionisti, e cioe' ad una frazione dell'immensa mole di persone che producono ricchezza reale scambiata poi con quei pezzi di carta? (per esempio: finanziare un lab per assicurarsi i diritti di sfruttamento economici anche della tecnologia distruptive successiva)No perche' se e' cosi': (a) il modello sostenibile non esiste, e (b) e' strategico si, ma solo per chi abita negli USA (mentre chi vive qui, usando gmail, uppando video su YouTube, etc. non fa altro che tagliarsi le palle da solo; eccezion fatta ovviamente per gli evangelist stipendiati da Google ... noti o meno ... che ne so, in Giappone ne hanno scoperti vari ... qui in Italia direi "Robin Good", direi "Luca Conti" ... ma non si puo' sapere con certezza ... plausible negability). Discorso diverso invece se il management di Google fosse subordinato a una Costituzione che implementa dei meccanismi democratici adeguati ai tempi (ie: efficaci) ... cioe' deterritorializzati ... e i meccanismi ultimi di redistribuzione della ricchezza (ie: finanza) fossero tali da garantire anche chi lavora in Italia. Se non altro cosi' avrebbe senso l'accordo che la RAI ha fatto per distribuire via YouTube tutta la produzione cinematografica italiana pagata con le tasse di due generazioni di italiani.E il tutto, come dice CSOE, all'interno di una pletora di "competitor" (presunti tali, perche' in realta' quella cosa della regolazione automatica di domanda e offerta e' una Gran Balla figlia della fervida mente di un doganiere scozzere di 300 anni fa, oggi per altro gia' smentita teoricamente da Stiglitz, e dimostrata empiricamente da Yunus) ... che nel frammentare quella necessita' servita da youtube non fanno altro che rallentarne l'evoluzione (perche' tanto se partono dopo, e non fanno massa critica con qualche escamotage ... come ad esempio avere capitali sufficienti a produrre/acquistare contenuti piu' rapidamente di quanto faccia youtube ... non vanno da nessuna parte), e quindi la nostra evoluzione. Sottraendo anche loro ricchezza ad un'enorme quantita' di persone completamente ignare del perche' oggi c'e' "la crisi" ...Lascia perdere Adam Smith, studiati Amartya Kumar Sen. Se non altro e' piu' attuale. Se non altro non perdi tempo.
  • bubba scrive:
    in pratica
    256 milioni/anno buttati per gli usurpatori di diritti... non male, maledetti "detentori". :P
Chiudi i commenti