Google Book Search sfoglia sempre meglio

Google Book Search sfoglia sempre meglio

BigG adotta nuovi strumenti per fagocitare più velocemente documenti scritti. Ma deve farsi largo tra chi grida al furto di opere e chi teme per l'accessibilità
BigG adotta nuovi strumenti per fagocitare più velocemente documenti scritti. Ma deve farsi largo tra chi grida al furto di opere e chi teme per l'accessibilità

L’acquisizione di libri non è più un ostacolo per Google. Il colosso del search ha brevettato un sistema, ideato da Francois-Marie Lefevere e Marin Saric, che renderà più veloce l’ingresso di nuovi titoli nell’archivio di Google Book Search .

Le ormai vecchie tecnologie di digitalizzazione richiedevano che ogni pagina arrivasse allo scanner in maniera nitida e, sopratutto, come immagine piana. Un’eventuale curvatura della pagina avrebbe infatti rischiato di compromettere l’attività del software OCR preposto alla digitalizzazione dei contenuti.

Il brevetto 7508978 , denominato Detection of grooves in scanned images , consente di superare l’ostacolo costituito dalla scanalatura centrale, tipica di molti supporti cartacei come libri o riviste, responsabile dell’inarcamento del foglio. Proiettando un raggio infrarosso sul libro aperto e con l’ausilio di due fotocamere ad infrarossi poste ai lati del dispositivo si otterrà l’immagine della pagina in tre dimensioni , indispensabile per determinare i parametri da utilizzare affinché il software la possa leggere in maniera corretta.

Google dunque non vivisezionerà più i volumi , in nome della fruibilità sul Web. Infatti fino a poco tempo fa, per risolvere il problema della convessità delle pagine rilegate, a Mountain View erano soliti ghigliottinare romanzi, saggi e trattati riducendoli a semplici risme da mandare alla scansione. In molti casi il sacrificio di una copia ai fini della conservazione online non era giudicato un delitto ma il discorso cambiava, e di molto, quando si mandavano al macello libri rari.

In ogni caso l’intento di raccogliere tutto lo scibile umano in qualche Tera aveva ricevuto in principio feedback positivi, tanto che sono molte le biblioteche che ad oggi hanno confermato la propria disponibilità a svuotare temporaneamente i propri scaffali per consentire l’indicizzazione.

Iniziato da Google nel 2004 questo processo di raccolta ha incontrato non pochi problemi legati al copyright , che secondo i legali di alcune case editrici veniva palesemente violato. Al mondo dell’editoria non andava proprio giù lo sfruttamento delle opere ancora coperte dal diritto d’autore, mentre tollerava che Google inglobasse senza sosta quelle di pubblico dominio.

Oltre ai chiarimenti ci sono voluti 125 milioni di dollari per far intuire ai manager delle case editrici le potenzialità commerciali messe a disposizione da Book Search. Tuttavia negli ultimi tempi l’operato di Mountain View è finito ugualmente sotto la lente d’ingrandimento dell’Antitrust , imbeccato da diversi oppositori, tra i quali figura il nome di Microsoft, secondo i quali tale accordo darebbe a Google il monopolio su quella fetta di mercato.

Brester Khale, fondatore di Internet Archive, si è schierato tra le fila degli avversari di BigG, sostenendo in un’intervista che le ambizioni del motore di ricerca vadano oltre ciò che si era prospettato all’inizio: Google vuole diventare la libreria o la biblioteca della Rete. Inoltre secondo Khale era ed è molto pericoloso permettere ad una sola entità di controllare l’accesso ad una quantità di contenuti che, grazie a quest’ultima trovata di Google, potrebbe crescere con velocità sempre maggiore.

Giorgio Pontico

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
5 mag 2009
Link copiato negli appunti