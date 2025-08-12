Reddit ha confermato che impedirà alla Wayback Machine di Internet Archive di indicizzare la maggioranza dei contenuti pubblicati sulla piattaforma. L’azienda di San Francisco vuole bloccare lo scraping indiretto da parte dei provider AI. Si tratta dell’ennesima puntata dello scontro iniziato oltre un anno fa.

Reddit fuori dalla Wayback Machine

A fine giugno 2024, Reddit ha comunicato che bloccherà tutti i bot AI, ad eccezione di quelli appartenenti alle aziende con le quali è stato sottoscritto un accordo di licenza, come Google e OpenAI. L’azienda californiana vuole quindi impedire lo scraping dei contenuti pubblici che vengono sfruttati per addestrare i modelli AI. Circa un mese fa ha denunciato Anthropic.

La Wayback Machine di Internet Archive è un archivio digitale che conserva le pagine web pubblicate a partire da maggio 1995. Gli utenti possono quindi trovare vecchi contenuti (rimossi o modificati) tornando indietro nel tempo. Per creare l’archivio utilizza un web crawler simile a quello di Google.

Ovviamente indicizza i contenuti di Reddit, quindi le aziende AI possono sfruttare una fonte alternativa, se i loro bot vengono bloccati da Reddit. Un portavoce ha dichiarato:

Internet Archive fornisce un servizio al web aperto, ma siamo stati informati di casi in cui le aziende di intelligenza artificiale violano le policy della piattaforma, inclusa la nostra, ed estraggono dati dalla Wayback Machine.

Reddit ha pertanto deciso di impedire alla Wayback Machine di accedere alle pagine di post, commenti e profili. Potrà indicizzare solo la home page, quindi Internet Archive potrà archiviare solo i titoli delle notizie e i post più popolari del giorno.

Reddit ha informato Internet Archive specificando che il blocco rimarrà finché non saranno in grado di proteggere il loro sito. Mark Graham, direttore della Wayback Machine, ha dichiarato che sono in corso discussioni con Reddit sulla questione.