Google studia l'evoluzione della lingua

Google studia l'evoluzione della lingua

BigG ha creato un database giantesco di parole per offrire metodi nuovi per la ricerca e lo studio delle discipline umanistiche. Oltre 5 milioni di libri digitalizzati, per comprendere meglio come cambia la società
BigG ha creato un database giantesco di parole per offrire metodi nuovi per la ricerca e lo studio delle discipline umanistiche. Oltre 5 milioni di libri digitalizzati, per comprendere meglio come cambia la società

Google Books ha creato un nuovo strumento di ricerca online utile per lo studio e la formazione nelle discipline umanistiche, mettendo a disposizione del pubblico oltre 500 miliardi di parole di libri pubblicati (e non) tra il 1800 e il 2008. Il magazzino digitale, che comprende le parole, le combinazioni di parole, di un totale di 5.2 milioni di libri digitalizzati, rappresenta il primo database di dati di questa portata e consentirà di analizzare le influenze culturali a livello statistico, metodo prima d’ora mai sperimentato. Il più famoso motore di ricerca darà vita ad una nuova disciplina per lo studio della cultura umana: l’ha già ribattezzato Culturomics .

Gli utenti potranno accedere al magazzino digitale e, selezionando e scaricando l’intero corpus di parole e sottoinsiemi in lingua inglese, cinese, russa, francese e spagnola, potranno costruire i propri strumenti di ricerca. Il pubblico di riferimento per la nuova trovata di Google è sicuramente il mondo accademico, ma tale strumento consente a chiunque con l’uso di un semplice PC di effettuare delle ricerche inserendo in una stringa un massimo di cinque parole per vedere, attraverso un grafico, i cambiamenti che sono avvenuti nel corso del tempo.

Con un click si potrà notare, ma questo non rappresenta che un piccolo esempio, che la parola “donne” a confronto con il termine “uomini” viene menzionata raramente fino ai primi anni del 1970, e inizia a comparire più spesso in seguito quando il femminismo prende piede, pareggiando, infine, nel 1986 circa.
Grazie alla vasta digitalizzazione di testi di Google si potranno tentare approcci innovativi per l’applicazione rigorosa dell’analisi statistica, che potrà finalmente interessare lo studio dell’evoluzione culturale che nel corso degli anni si è rivelata difficile da analizzare.

“L’obiettivo è quello di dare la possibilità di esplorare le tendenze culturali in tutta la storia, così come è registrato nei libri”, ha dichiarato Erez Lieberman Aiden, ricercatore presso Harvard. Lieberman Aiden e Jean-Baptiste Michel hanno guidato un progetto di ricerca per dimostrare quanto sia vasto il database digitale e quanto esso sia in grado di trasformare la nostra comprensione della lingua, della cultura e del flusso di idee. Il loro studio, che sarà pubblicato sulla rivista Science , offre un assaggio delle opportunità di ricerca che con tale strumento si aprono alla letteratura, alla storia e per le arti liberali.

Steven Pinker, un linguista di Harvard che ha collaborato nella sezione di Science per l’evoluzione delle lingue, ha studiato i cambiamenti nella grammatica nel corso di 20 anni. “Quando ho visto che avevano questo database, ero piuttosto eccitato” ha detto. “C’è così tanta ignoranza. Abbiamo dovuto ipotizzare cosa sarebbe successo alla lingua”. Il linguista si è detto fiducioso sull’uso di strumenti di questa portata e simili augurandosi una diffusione a livello universale.

Intanto al vaglio dei giudici c’è la questione sul diritto d’autore e del conseguente risarcimento intentate da scrittori ed editori come conseguenza al progetto di digitalizzazione di Google. La società afferma che il progetto culturomics non pone alcun problema di copyright perché i libri stessi, o anche le sezioni di loro, non possono essere letti.

Raffaella Gargiulo

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
17 dic 2010
Link copiato negli appunti