Neppure Google può misurare il Web

Neppure Google può misurare il Web

Mountain View azzarda: saranno circa mille miliardi di pagine. Ma non tutte compaiono nei risultati delle ricerche, e l'indice di Google rimane avvolto nel mistero
Mountain View azzarda: saranno circa mille miliardi di pagine. Ma non tutte compaiono nei risultati delle ricerche, e l'indice di Google rimane avvolto nel mistero

Quanto è grande il Web? Gli spider di Google scorrazzano di link in link, brulicano fra i contenuti depositati in rete, tengono traccia di come evolve l’intrico di link e contenuti che compone il Web. Ma nemmeno Google sa offrire una stima attendibile delle dimensioni del WWW.

Sono più di mille miliardi le URL uniche censite da Google, sono mille miliardi le pagine riempite di contenuti originali a favore dei cittadini della rete: a comunicarlo sono Jesse Alpert e Nissan Hajaj, ingegneri software impiegati nella divisione search dello sfaccettato colosso di Mountain View. Le pagine censite dai motori di ricerca aumentano a ritmi vertiginosi, alimentate da automatismi e dalla creatività delle persone che popolano il web: le nuove pagine che ogni giorno rimpinguano il web si contano nell’ordine dei miliardi .

Google snocciola numeri da capogiro ma il suo indice non è a tal punto sconfinato : Google è venuto a contatto con mille miliardi di pagine, ma non tutte vengono indicizzate e restituite in risposta delle ricerche dei cittadini della rete. Google agisce da gatekeeper, consente di raggiungere gli anfratti più remoti del WWW, le pagine più neglette e meno linkate dai netizen. Ma non garantisce l’accesso ai mille miliardi di pagine che i suoi spider hanno pattugliato: i contorni e le dimensioni dell’indice di Google restano avvolti nel mistero.

Fino a pochi anni fa BigG mostrava con orgoglio il numero delle pagine che componevano il proprio indice: un contatore nella homepage dava l’idea della vastità dell’indice su cui Google poteva contare. Il motore di Mountain View aveva iniziato ad operare su 26 milioni di pagine nel 1998, nel 2000 poteva contare su un indice di un miliardo di pagine. Esattamente un anno fa la grande G operava su otto miliardi abbondanti di pagine.

Google nel 2005

In seguito agli accesi confronti con la concorrenza, Google aveva smesso di vantare le dimensioni del proprio indice. Queste dimensioni, sostengono in molti, non sono un indicatore della qualità di un motore di ricerca: ai numeri in crescita vertiginosa Google ha così sostituito il più stretto riserbo.

Non è tuttora possibile sapere quanto sia vasto l’indice di Google: certo è che, sottolineano in molti, il numero delle pagine che possono comparire nei risultati delle ricerche non si avvicina lontanamente ai mille miliardi annunciati da Google. Ad ammetterlo sono gli stessi ingegneri di Mountain View: se non rinunciano a vantare “l’indice più esaustivo rispetto fra tutti i motori di ricerca”, spiegano che “non indicizziamo ognuna di questi mille miliardi di pagine: molte di esse sono simili l’una all’altra, o rappresentano contenuti auto-generati che non sono utili a coloro che effettuano delle ricerche”.

Cosa rappresenta dunque il traguardo dei mille miliardi di pagine? È un indizio riguardo alle dimensioni del Web? Nemmeno Google sembra saperlo con certezza: a chi si chiede di quante pagine si compone l’intrico delle rete, Google ammette socraticamente di non sapere: “Non abbiamo tempo di guardarle tutte – spiegano da Mountain View – il numero di pagine là fuori è infinito”. Da Google si smarcano spiegando che “le dimensioni del web dipendono dalla definizione che ciascuno dà di pagina utile”: sommando le pagine utili alle pagine inutili, inserendo paradossalmente nel computo spam e domini parcheggiati, si potrebbe già aver raggiunto il Googol .

Gaia Bottà

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
28 lug 2008
Link copiato negli appunti