I bot di Google indicizzano i testi nelle immagini

Mountain View indicizza anche i contenuti dei documenti digitalizzati a mezzo scanner. Un tocco di OCR e le immagini formato pdf diventano materiale ricercabile e con cui sferruzzare

Roma – I bot di Google sgusciano anche fra file postati come immagini, fra le ricerche compaiono risultati estratti da documenti che i netizen si sono limitati a digitalizzare con uno scanner. Un’immagine composta da una manciata di parole diventa una manciata di parole a cui Google consente di accedere attraverso una ricerca.

I testi contenuti in questi documenti non saranno più isolati dalla rete: dopo aver lavorato sui contenuti flash, Google si sta industriando per trasformare in testi da indicizzare tutti i documenti postati in formato pdf sotto forma di immagini, per garantire ai netizen l’accesso a documenti prima inaccessibili se non si era a conoscenza della URL presso cui potevano essere rintracciati o dei metadati su cui fare leva, per garantire ai netizen la possibilità di attingere a risorse formato immagine che sappiano rispondere alle loro domande.

“Ogni giorno, persone di tutto il mondo postano online documenti digitalizzati – illustrano da Mountain View nel blog ufficiale – Questi file solitamente contengono immagini di testi, piuttosto che testi veri e propri. Ma tutti questi documenti hanno una cosa in comune: qualcuno da qualche parte ha pensato che fossero abbastanza di valore per essere condivisi con il mondo”. Alcuni documenti sono già stati indicizzati , alcune immagini sono già state trasformate in risorse accessibili attraverso i motori di ricerca: è possibile accedere ai paragrafi più remoti di documenti accademici redatti con una macchina da scrivere e in precedenza pressoché irraggiungibili, è possibile consultare decisioni di tribunali che ancora non hanno proceduto alla completa migrazione al digitale.

La tecnologia che Google ha messo in campo per rendere accessibile l’informazione formato immagine è OCRopus, sviluppata da HP, coltivata da Mountain View e rilasciata affinché tutti la possano affinare. Non è dato sapere in che porzione i documenti che circolano in rete formato immagine siano stati affidati all’interprete di Google: il blog di Mountain View fa ora riferimento a quattro immagini pdf convertite in testo e in formato html. È così che i netizen possono attingere ai documenti ed estrapolare citazioni senza doversi improvvisare amanuensi da tastiera.

Il sistema OCR di Google ancora non distingue le immagini presenti nel testo dalle immagini del testo: nelle versioni ricercabili dei pdf non vengono incluse le immagini che arricchiscono i documenti digitalizzati.

La conversione massiva in testo dei documenti in formato immagine, secondo alcuni osservatori apre scenari inquietanti per quanto riguarda la privacy dei cittadini i cui dati personali siano contenuti in documenti emessi da istituzioni che non abbiano ora delegato a Google la transizione completa al digitale. Ma, una volta immessa in rete, è impensabile arginare l’informazione: “Questo – conferma Evin Levey, dirigente di Google – è un piccolo ma importante passo in avanti nella nostra missione tesa a rendere accessibile e utile tutta l’informazione del mondo”.

Gaia Bottà

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicato. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy

  • AxAx scrive:
    Quello che disse l'uomo dell'Aci...
    a Furio è quello che va detto ai produttori di Hollywood
    • Funz scrive:
      Re: Quello che disse l'uomo dell'Aci...
      - Scritto da: AxAx
      a Furio è quello che va detto ai produttori di
      HollywoodE che disse l'uomo dell'ACI a Furio?
      • Deboroh scrive:
        Re: Quello che disse l'uomo dell'Aci...
      • Deboroh scrive:
        Re: Quello che disse l'uomo dell'Aci...
        http://www.youtube.com/v/_2RjhGKlD-k&hl
        • Guybrush scrive:
          Re: Quello che disse l'uomo dell'Aci...
          - Scritto da: Deboroh
          http://www.youtube.com/v/_2RjhGKlD-k&hl...risposta SPETTACOLARE.Ei tu, ei tu... cliente, guarda che devi pagare per vedere il mio film, devi pagare quando vai al cinema, devi sciropparti la pubblicita' al cinema e lo spot antipirateria perche' sotto sotto l'occasione fa l'uomo ladro e tu sei un uomo. Devi pagarmi il DVD che porti a casa e puoi vederlo solo sui lettori che dico io, in caso ti compri un lettore adatto, in fondo costano meno dei film. Te li metto su un supporto che in 10 anni e' obsoleto (e forse anche illegibile) e non puoi fartene il backup a meno che non paghi di nuovo... ah si, c'e' la pubblicita' e lo spot antipirateria pure li dentro.E a quel punto ri-scatta la risposta:http://www.youtube.com/v/_2RjhGKlD-k&hlGT
        • Mr. lo Pesce scrive:
          Re: Quello che disse l'uomo dell'Aci...
          - Scritto da: Deboroh
          http://www.youtube.com/v/_2RjhGKlD-k&hlUhei, hai violato il copyright!
  • Cobra Reale scrive:
    Due esempi di danno economico
    Dato che le major di Hollywood ci tengono a che il loro CSS sia rispettato, ecco due esempi di danno economico inflitto alla "povera" MPAA da quei cattivacci che violano il CSS:1) Un appassionato che vuole vedere il suo DVD originale tutte le volte che vuole, per colpa di quei diabolici pirati potrà farne una copia di sicurezza da "maltrattare" e tenere l'originale in archivio, invece di essere costretto a riprodurre l'originale per poi comprarne un altro quando si rovina. Il danno è reso ancora più grave se consideriamo che con un sistema anticopia infallibile le major avrebbero potuto vendere i film su dischi di qualità modesta senza abbassarne il prezzo, certe di poter contare su polli da spennare pronti a comprare un nuovo disco originale dopo che un esiguo numero di riproduzioni ha rovinato quello precedente;2) Un appassionato che vuole vedere i film in lingua originale e se ne frega dell'Italiano, per colpa di quei delinquenti irrispettosi dei diritti d'autore potrà comprarlo all'Estero se la versione Italiana costa molto di più, rubando il pane di bocca a quei mansueti squali bianchi come la neve, che si guadagnano da vivere imponendo restrizioni alla libera commercializzazione dei dvd originali in giro per il Mondo!MALEDETTI TUTTI QUELLI CHE NON ASCOLTANO LA PAROLA DELLE MAJOR E NON LA VIVONO OGNI GIORNO! :@ :@ :@La vostra sorte è segnata, vista la vostra depravazione e la vostra immoralità finirete tutti all'inferno! @^
    • Dott. Daniel J. scrive:
      Re: Due esempi di danno economico
      Ma che , gli Orai (*) sono già arrivati sulla terra? :s :(:'((*) Non mo la ben che minima idea della sintassi, sorry, pertanto uso la translitterazione italiana, però....la senzazione...sapete com'è.... :D
    • scorpioprise scrive:
      Re: Due esempi di danno economico
    • Wolf01 scrive:
      Re: Due esempi di danno economico
      Diciamo che se fingono di essere troppo benevoli non guadagnano abbastanza, è già tanto che vendono i prodotti invece di tenerli tutti per loro, chiusi in qualche bunker, e mostrando i film solo al cinema, neanche per tv perchè potresti registrarli... si ok, pure al cinema ma sono pietosiMa quello che sinceramente non capisco, ok che esistono brevetti e compagnia, ma se in uno Stato che se ne frega di quelle cose e anzi permette alle sue industrie di produrre quello che pare e piace qualcuno mette su una fabbrica di lettori dvd, perchè questi devono arrivare e dire "Tu per noi stai commettendo qualcosa di illegale, dovrai sottostare alle leggi americane, in barba al fatto che tu sia in Cina, devi controllare quello che fanno i tuoi clienti e imporre le nostre rigide regole"Ci sono ben 2 cose importanti e completamente sbagliate:1) una multinazionale che sta sopra il potere delle nazioni2) che bisogni sottostare alle regole americane, visto che là è il paradiso della MPAA e RIAA e quindi possono fare quello che vogliono: accusare, molestare, taglieggiare, minacciare, incarcerare nei cinema, mandare Roger Rabbit a chiedere il pizzoMa stiamo diventando matti? Capisco che la sete di denaro sia infinita, ma una volta che il denaro ce l'hanno tutto loro cosa sperano di fare? Costruirsi una nave spaziale e andare in qualche altro pianeta per depredare dei poveri alieni come delle locuste assassine?
Chiudi i commenti