Google spinge la ricerca in tempo reale

A Mountain View si industriano per cercare di rincorrere il World Wide Web fino all'ultimo bit. Il nuovo protocollo è aperto ai concorrenti e adottato anche da WordPress: servirà a scovare le informazioni prima e più facilmente
A Mountain View si industriano per cercare di rincorrere il World Wide Web fino all'ultimo bit. Il nuovo protocollo è aperto ai concorrenti e adottato anche da WordPress: servirà a scovare le informazioni prima e più facilmente

Google prosegue nella sua corsa infinita al tempo reale e all’indicizzazione dei contenuti negli istanti successivi alla loro comparsa sul web già annunciata lo scorso anno , e lo fa con il protocollo open source Pubsubhubbub . PuSH è un’estensione del protocollo di “syndication” Atom/RSS, ed è stato pensato espressamente per tradurre la facilità di “registrazione” all’aggiornamento dei contenuti di un sito tipica dei feed RSS in una rete capace di facilitare enormemente il compito di indicizzazione ai provider dei servizi di ricerca online .

Nella rete di PuSH il webmaster dichiara a quale “Hub” il suo sito intende registrarsi e spedire la notifica dopo un aggiornamento ai contenuti disponibili. Diversamente dagli RSS standard, però, Google può usare le informazioni di registrazione dichiarate dal sito per integrare questi update nello stream di dati che finisce dritto nel suo sistema di indicizzazione del web, aggiornando le informazioni disponibili su un sito senza la necessità di spedire in giro per la rete un crawler a fare incetta di keyword.

Attualmente la capacità di aggiornamento dell’enorme indice di contenuti di rete in mano a Google è quantificabile nell’ordine di una decina di secondi , nondimeno l’adozione estesa di PuSH genererebbe una serie notevole di ricadute positive per il business del search in quel di Mountain View. Una eventuale sostituzione dell’attuale sistema di crawling con il nuovo meccanismo non solo ridurrebbe i tempi di sondaggio del “web là fuori”, ma (soprattutto) alleggerirebbe e non poco lo stress computazionale della sofisticata infrastruttura hardware che muove i destini del Googleplex.

Non di semplice “tempo reale” insomma si tratterebbe, ma di un vero e proprio avanzamento tecnologico del search, tanto che gli ingegneri del software di BigG hanno preferito mantenere un approccio open dando la possibilità ai concorrenti (Yahoo! e Bing) di mettere alla prova il sistema. PuSH promette di avere un impatto significativo sulle fondamenta funzionali del World Wide Web e WordPress ne sposa la causa implementandolo negli oltre 10 milioni di blog ospitati dalla piattaforma.

WP è d’altronde da tempo impegnato a migliorare le modalità di accesso ai contenuti, come dimostra la precedente adozione di Rsscloud , un sistema di syndication costruito sui feed RSS che ha lo scopo di trasformare ogni feed in una fonte “attiva” di update, piuttosto che un canale da consultare di quando in quando per individuare la presenza di nuovi contenuti come avviene di norma.

Tornando all’indicizzazione dei siti web in tempo reale, infine, se Google & co spendono notevoli energie per sottolinearne l’importanza, gli utenti sembrano avere altre priorità . Una ricerca condotta da OneUpWeb metterebbe infatti in luce il fatto che la maggioranza dei netizen, dei risultati in tempo reale, non conosce l’esistenza e non sa che farsene .

Alfonso Maruccia

Link copiato negli appunti

Ti potrebbe interessare

05 03 2010
Link copiato negli appunti