La Wayback Machine rischia di scomparire per colpa dello scraping AI. Molti editori hanno bloccato il web crawler di Internet Archive perché gli articoli conservati nell’archivio digitale vengono “rubati” dai bot delle aziende che sviluppano modelli di intelligenza artificiale. Il popolare servizio subisce in pratica un danno collaterale per colpa di terzi.
Internet Archive ha un valore inestimabile
La Wayback Machine di Internet Archive è un archivio digitale che conserva le pagine web pubblicate a partire da maggio 1995. Gli utenti possono quindi trovare vecchi contenuti (rimossi o modificati) tornando indietro nel tempo. A fine ottobre 2025 ha superato un trilione di pagine archiviate. L’organizzazione non-profit conserva anche immagini, software, video e audio. La recente aggiunta di oltre 10.000 registrazioni di concerti dimostra che il lavoro Internet Archive ha un valore inestimabile.
Da agosto 2025, Reddit ha iniziato a bloccare il bot di Internet Archive (ia_archiverbot) usato per il progetto Wayback Machine, la macchina del tempo delle pagine web. Anche molti editori statunitensi hanno bloccato l’accesso agli articoli.
USA Today ha recentemente pubblicato un report sulle attività dell’ICE, utilizzando la Wayback Machine come fonte. USA Today è uno degli editori che blocca il bot di Internet Archive. Una portavoce ha dichiarato che lo scopo non è bloccare il bot di Internet Archive, ma quello di bloccare lo scraping AI.
I bot delle aziende che sviluppano modelli di intelligenza artificiale non possono accedere alla fonte originaria, quindi aggirano il blocco passando per la Wayback Machine. In pratica, il servizio di Internet Archive subisce un danno collaterale e rischia di scomparire.
Fight for the Future, Electronic Frontier Foundation e altre organizzazioni hanno ottenuto il sostegno di oltre 100 giornalisti che riconoscono il valore della Wayback Machine e hanno presentato una lettera di supporto a Internet Archive.
Nelle generazioni precedenti, i giornalisti si rivolgevano agli archivi fisici di un giornale locale o di una biblioteca pubblica per accedere a reportage storici e seguire le tracce del presente nella storia. Con la chiusura di molti giornali e senza una chiara via per le biblioteche pubbliche locali per preservare i reportage esclusivamente digitali, il compito di salvaguardare la documentazione giornalistica ricade sempre più su Internet Archive.
I giornalisti firmatari considerano Internet Archive un tesoro nazionale. La storia digitale potrebbe essere persa per sempre, in quanto non esiste nessun servizio pubblico come la Wayback Machine.