Ma le bombs sono rimaste su Google

di A. Bottoni - Google ha modificato l'algoritmo di page ranking per porre fine al fenomeno del Google bombing. Tuttavia, molte Google bombs sono ancora al loro posto. Che cosa sta succedendo?
di A. Bottoni - Google ha modificato l'algoritmo di page ranking per porre fine al fenomeno del Google bombing. Tuttavia, molte Google bombs sono ancora al loro posto. Che cosa sta succedendo?

Una Google bomb è una alterazione deliberata ed artificiale del “punteggio” ( page rank ) che Google attribuisce ad una specifica pagina web, solitamente studiata in modo tale che la pagina “bersaglio” risulti tra le prime dieci che vengono elencate tra i risultati quando si effettua la ricerca di un determinato termine.

Ad esempio, se cercate il termine Wi-MAX con Google, vedrete che la seconda voce che appare tra i risultati della ricerca fa riferimento ad un appello del Partito Pirata Italiano per la liberazione delle frequenze necessarie. Questa pagina si chiama “Liberate il Wi-MAX” e la trovate a questo indirizzo: http://www.partito-pirata.it/liberate_il_WIMAX.html . Potete provare voi stessi questa ricerca facendo click sul link sottostante:
Ricerca di Wi-MAX con Google

Il fatto che questa pagina risulti al secondo posto nell’elenco dei risultati è l’effetto di una Google bomb che abbiamo organizzato a Gennaio del 2007 (L’ideatore di questa iniziativa, e l’autore del documento del Partito Pirata, è anche l’autore di questo articolo). Grazie a questo posizionamento privilegiato, abbiamo ottenuto il risultato di far conoscere le nostre idee riguardo alla liberazione delle frequenze del Wi-MAX a praticamente tutte le persone che si sono interessate di Wi-MAX negli ultimi due mesi e che hanno usato Google per cercare documentazione su questo argomento.

Come funziona Google
Il Google bombing sfrutta una caratteristica di Google che si trova alla base del suo funzionamento: il meccanismo di page ranking .

Quando Sergey Brin e Lawrence Page hanno messo a punto l’algoritmo di base di Google , hanno cercato di fare qualcosa di decisamente più efficace di quello che riuscivano a fare i motori di ricerca del tempo (in particolare Yahoo! ). I motori di ricerca degli anni ’90 si limitavano ad esplorare la rete ed a creare degli immensi cataloghi di pagine web, classificati in base alle parole chiave che contenevano, senza una vera organizzazione. L’unico modo di ottenere ciò che si cercava era quello di combinare tra loro un numero abbastanza elevato di parole chiave significative in modo da ottenere un numero di risultati abbastanza contenuto da permettere di terminare la ricerca “a mano”, esaminando una ad una le pagine.

La goffaggine di questo meccanismo, insieme alla enorme quantità di annunci pubblicitari che inquinavano le pagine dei motori di ricerca, ha avuto l’effetto di allontanare gli utenti da questi strumenti e di decretare l’effimero successo dei ” portali ” (“web directory”). Come ricorderete, i portali erano cataloghi di siti web pre-selezionati da una èquipe di specialisti. Il più famoso di questi è probabilmente DMoz .

Brin e Page pensarono di usare un meccanismo più sofisticato, basato su un corollario del cosiddetto “effetto rete” (” network effect “). Questo corollario recita: Un elemento della rete è tanto più importante per la rete stessa quanto maggiore è il numero degli altri elementi che fanno riferimento ad essa

Nel caso delle pagine web (e di interi siti), l’importanza della pagina è tanto maggiore quanto più elevato è il numero delle pagine web che contengono un collegamento (“link”) ad essa. Questo meccanismo è noto anche come Link Analysis e si appoggia ad una teoria matematica nota come Analisi Markoviana dei Processi .

La versione originale dell’algoritmo di Brin e Page, concepito come tesi di laurea a Stanford, è ancora oggi reperibile su Internet a questo indirizzo . Da allora, a questo algoritmo sono state apportate diverse modifiche ma il suo funzionamento resta sostanzialmente lo stesso.

In pratica, Google funziona nel modo seguente:

1. Ad intervalli regolari (una volta ogni settimana o due), un apposito programma, chiamato “spider” o ” crawler “, “spazza” il world wide web alla ricerca di pagine web.
2. Da ognuna di queste pagine web, lo spider estrae una serie di termini che possono essere usati per la ricerca, le cosidette “keyword”. La pagina viene catalogata tra quelle che contengono ognuno di questi termini, in modo che sia possibile ritrovarla in seguito. Questo processo è noto come ” indicizzazione “.
3. Per ognuna di queste pagine viene determinato anche il numero di altre pagine che fanno riferimento ad essa attraverso un link. Questo processo è noto come ” page ranking “.

In seguito, quando l’utente cerca una determinata parola chiave, Google agisce nel modo seguente:

1. Esamina i suoi indici e carica un elenco di tutte le pagine che contengono il termine cercato.
2. Queste pagine vengono elencate in base al loro page rank. Maggiore il page rank, più alta la loro posizione nell’elenco.

Dato che gli utenti raramente esaminano le voci che appaiono oltre la decima o la ventesima posizione dell’elenco, ottenere un elevato page rank è vitale per calamitare l’attenzione del pubblico. In realtà, ottenere questo risultato è talmente importante che sul web esistono decine di agenzie che di mestiere fanno solo questo: cercano di far arrivare i siti dei loro clienti tra le prime dieci posizioni dell’elenco quando si effettua la ricerca di determinati termini. Si tratta delle agenzie di Search Engine Optimization (SEO). Il Google bombing sfrutta il meccanismo di Page Ranking nel più ovvio dei modi: se la posizione della pagina nell’elenco dei risultati dipende dalla sua “popolarità” sulla Rete, misurata dal numero delle altre pagine che fanno riferimento ad essa, allora basta creare un elevato numero di pagine “referenti” che puntano alla pagina “bersaglio” attraverso un apposito link.

Questo è esattamente quello che abbiamo fatto con il Google bombing relativo al Wi-MAX: abbiamo chiesto a tutte le persone che la pensavano come noi di pubblicare sul web una pagina che contenesse il termine “Wi-MAX” e che contenesse anche un link alla pagina con il nostro appello.

Addirittura, i nostri “seguaci” non hanno nemmeno dovuto scrivere una pagina di loro concezione: è stato sufficiente ripubblicare la pagina target su altri siti. Questo è stato possibile perchè la pagina target conteneva sia il termine Wi-MAX, sia il link a se stessa, nella versione pubblicata sul sito del Partito Pirata, sia le istruzioni necessarie per partecipare al nostro Google bombing. Per questo motivo, la pagina target è stata pubblicata sotto una apposita licenza Creative Commons , in modo che chiunque la potesse ripubblicare (ma non alterare).

Tre settimane dopo la pubblicazione dell’annuncio, il nostro appello era già tra le prime cinque pagine elencate da Google in seguito alla ricerca del termine “Wi-MAX”. A distanza di un mese, era la seconda dietro la imbattibile pagina Wi-MAX di Wikipedia .

Il nuovo algoritmo di Google
Secondo quanto ha annunciato Mutt Cutts il 25 Gennaio 2007, l’algoritmo di page ranking di Google è stato modificato in modo da impedire la creazione di Google bombs. L’articolo orginale di Cutts, in inglese, è reperibile a questo indirizzo .

Questa decisione è stata presa dopo che il meccanismo delle Google bombs è stato usato (per anni) per creare imbarazzanti associazioni tra i nomi di politici e personaggi in vista e termini poco lusinghieri. Ad esempio, fino alla introduzione di questo nuovo meccanismo, cercando “miserable failure” con Google, si otteneva come primo risultato la biografia del Presidente George W. Bush.

Cosa si sa del nuovo algoritmo anti-bombe di Google
Subito dopo l’introduzione di questo nuovo algoritmo, sul web sono spuntate come funghi le analisi degli specialisti. Il motivo di questo interesse è ovviamente legato ai possibili effetti che questo nuovo algoritmo potrebbe avere sul mercato delle SEO agencies. Inoltre, per ragioni facilmente comprensibili, Google non ha pubblicato alcuna descrizione di questo nuovo algoritmo, lasciando molto spazio alle illazioni.

Potete leggere voi stessi alcune analisi interessanti (tutte in inglese) a questi indirizzi:
e-Business Strategies
Dallas SEO BlogSpot
DaniWeb
Marketing Pilgrim

Contrariamente a quello che si potrebbe pensare, le analisi più interessanti non sono state quelle di tipo matematico/algoritmico ma quelle di carattere più strettamente pratico. In particolare, Allen Taylor ha fatto notare alcune cose interessanti in un suo articolo del 19 febbraio 2007 intitolato Google Fixed Their Google Bomb Problem – Or Did They? .
Taylor ha fatto notare due cose. La prima è che solo le Google bombs fortemente negative (offensive) sono state spazzate via dal nuovo algoritmo. La seconda è che molte altre note Google bombs sono ancora al loro posto. Lo si può vedere bene effettuando le due ricerche che seguono:
Ricerca di Google per Miserable Failure
Ricerca di Google per Great President

Entrambe queste ricerche sono state l’oggetto di due famose e pesantissime azioni di Google bombing, la prima messa in atto dagli avversari di George W. Bush e la seconda dai suoi sostenitori. Come potete vedere, solo la seconda è ancora funzionante.
Vale la pena notare che anche la nostra Google bomb sulla liberazione delle frequenze per il Wi-MAX è ancora funzionante: Ricerca di Google per Wi-MAX . E vale la pena notare che anche nel nostro caso si tratta di una Google bomb che non ha contenuti offensivi.

Allen Taylor, da questi dati, trae la conclusione (a mio parere sbagliata) che Google abbia messo in atto un meccanismo che elimina solo le Google bombs di contenuto offensivo.

Personalmente non credo che sia così. Il motivo è semplice: per distinguere una parola di contenuto offensivo da una di altro tipo è necessario, anzi inevitabile, usare un dizionario di parole proibite, cioè una blacklist di dirty words . Google ha sempre sostenuto di non fare uso di blacklist. Per essere più precisi, Google è costretta a non usare blacklist per non suscitare una levata di scudi di portata mondiale tra le aziende che fanno uso del suo motore di ricerca per azioni di marketing (le SEO agencies) e tra i movimenti a sostegno dei diritti civili. Se Google ammettesse di fare uso di blacklist, in qualunque modo, verrebbe immediatamente tacciata di comportamenti censori e di comportamenti anti-commerciali. Semplicemente, è un lusso che non può permettersi.

Quello che probabilmente Google sta usando è un altro approccio: eliminare solo le Google bombs vere e proprie, lasciando invece al loro posto le azioni di marketing delle SEO Agencies e le azioni “politiche” dei gruppi di cittadini. Questo è un effetto che può essere ottenuto in modo del tutto algoritmico (senza fare uso di blacklist) ed il suo effetto sarebbe esattamente quello che Allen Taylor ha rilevato.

Probabilmente, Google usa una serie di indizi per capire se la elevata popolarità di una pagina web è dovuta ad una Google bomb o è l’effetto di una reale popolarità tra la gente, anche se ottenuta con mezzi artificiali come un appello politico od una azione di marketing. Questi indizi potrebbero essere i seguenti.

1. La pagina “target” e le pagine “referenti” appaiono quasi nello stesso momento, segno che c’è stata una certa premeditazione.
2. Le pagine referenti appaiono nell’arco di poco tempo, segno che ci si trova di fronte ad una azione organizzata.
3. Le pagine referenti sono quasi tutte uguali tra loro, segno che non si tratta di opere diverse, che contengono opinioni individuali, ma della stessa pagina ripubblicata pedestremente più volte.
4. Le pagine referenti appaiono su servizi di web publishing gratuiti, come wordpress.com , blogger.com e via dicendo. Questo è un segno che chi partecipa al Google Bombing non appartiene alla ristretta èlite dei professionisti del web (che hanno siti commerciali da utilizzare a questo scopo) ma piuttosto al mare magnum dei “movimenti” sociali della rete.
5. Le pagine referenti hanno a loro volta una bassa o addirittura nulla popolarità sulla rete (nessuno o quasi fa riferimento ad esse con un link). Questo vuol dire che sono pagine create di recente, ad hoc per questa azione, e che, probabilmente, non contengono nulla di interessante per un lettore umano.
6. Le pagine referenti contengono poco testo e/o molti link, segno che non sono destinate ad essere lette da un essere umano.

In particolare, il fattore tempo (pagine che spuntano come funghi) ed il fattore popolarità (pagine referenti sconosciute ai più sulla rete) sono indizi molto efficaci per riconoscere una vuota azione di Google bombing, di tipo meramente “goliardico”, da una azione dotata di qualche contenuto informativo e comunicativo.

Probabilmente, è questa la ragione per cui il nostro appello sul Wi-MAX è ancora tra i primi risultati di Google: questa “Google bomb” è sostenuta da persone che fanno uso di siti web commerciali, molto conosciuti in rete, e quindi l’autorevolezza dei loro link è tale da “tenere a galla” la pagina target. Detto in un altro modo: questa Google Bomb riflette una reale popolarità della pagina target sulla Rete e quindi non può essere rimossa senza alterare la validità dei risultati della ricerca. Questo ci porta a spiegare per quale motivo il nuovo meccanismo di Google potrebbe non rappresentare la fine delle Google bombs. Molte Google bombs, come quella sul Wi-MAX, riflettono una reale popolarità della pagina target sulla rete, ottenuta attraverso una azione di sensibilizzazione politica deliberata ed organizzata. Per quanto possa essere artificiale il meccanismo di promozione della pagina target, la sua popolarità è reale. Di conseguenza, la Google bomb non può essere rimossa senza alterare in modo sensibile la credibilità e l’accuratezza dei risultati della ricerca.

Ma c’è di più: le agenzie pubblicitarie di Internet, cioè le SEO Agencies, operano nello stesso identico modo in cui abbiamo operato noi per il Wi-MAX, forse in modo ancora più discutibile. Queste agenzie fanno salire il page rank della pagina web del loro cliente pubblicando decine, centinaia o persino migliaia di pagine web referenti su vari siti web compiacenti, sia pagando per il servizio, sia gestendo direttamente questi siti. Inutile dire che le pagine referenti contengono poco o nulla di interessante per il lettore e che sono abitualmente sconosciute agli internauti (che si guardano bene dal linkarle).

Anche nel caso delle SEO Agencies, comunque, la popolarità delle pagine da loro promosse è reale, anche se ottenuta con mezzi artificiali, e quindi non può essere ignorata senza alterare la credibilità e la validità dei risultati di una ricerca.

Di conseguenza, se Google mettesse veramente in atto un meccanismo efficace contro le Google bombs di carattere “politico”, come la nostra sul Wi-MAX, prima ancora di spazzare via queste Google bombs, il loro algoritmo spazzerebbe via tutto il lavoro svolto (in modo del tutto legittimo) dalle SEO Agencies. Google stessa vive, direttamente od indirettamente, attraverso AdSense ed altri meccanismi, del lavoro di queste agenzie per cui sarebbe la prima a subire danni economici rilevanti da una azione del genere. Questo senza contare la immediata ed inferocita reazione degli operatori commerciali del settore.

Più in dettaglio, è lecito pensare che Google non si permetterà mai di rimuovere dai suoi risultati le “Google bombs” che rispondono ai seguenti requisiti.

1. Le pagine (od i siti) referenti hanno una loro popolarità in rete, segno che la popolarità della pagina target in rete misura una popolarità reale del suo messaggio tra la gente.
2. Oppure, le pagine referenti sono ospitate su siti sui quali è possibile pubblicare una pagina solo se si riesce a convincere in qualche modo il web master, segno che o la pagina ha una forte rilevanza socio-politica o che chi l’ha pubblicata ha speso dei soldi (e quindi è quasi certamente un operatore economico).
3. Le pagine referenti sono diverse tra loro, segno che sono opera di persone diverse che esprimono opinioni diverse.
4. Le pagine referenti contengono testo “leggibile” di una certa estensione, non sterili elenchi di link, segno che sono destinate ad essere lette da un essere umano.

Un mondo migliore senza Google bombs?

A questo punto dovrebbe essere chiaro che le Google bombs di contenuto non strettamente “goliardico” continueranno ad esistere a lungo, come peraltro dimostra la sopravvivenza della Google bomb sul Wi-MAX e di molte altre simili ad essa. Saranno solo le Google bomb goliardiche, prive di un reale contenuto informativo e comunicativo, a sparire.

Personalmente, credo che questo sia anche ciò che noi tutti dobbiamo augurarci. Il mondo è certamente migliore senza la Google bomb che legava “miserable failure” a George W. Bush (e ve lo dice uno che non ama Bush) ma sarebbe migliore anche se sparissero le azioni di sensibilizzazione politica come quella che abbiamo condotto sul Wi-MAX?

Alessandro Bottoni
www.oceanidigitali.it

Link copiato negli appunti

Ti potrebbe interessare

08 03 2007
Link copiato negli appunti