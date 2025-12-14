La RSL Collective ha annunciato le specifiche ufficiale del Really Simple Licensing (RSL) 1.0. Si tratta dello standard che permetterà agli editori di definire i termini d’uso e le licenze per lo scraping da parte dei crawler AI. È in pratica una versione aggiornata del Robots Exclusion Protocol che non viene sempre rispettato.

Blocco dei bot più efficace?

Quasi tutte le aziende che sviluppano modelli di intelligenza artificiale generativa sfruttano contenuti web pubblici per l’addestramento. Lo scraping avviene con crawler (bot) dedicati che (teoricamente) possono essere bloccati attraverso il Robots Exclusion Protocol (file robots.txt). Non esiste tuttavia nessun obbligo di rispettare il blocco, quindi viene spesso aggirato.

RSL 1.0 dovrebbe essere una soluzione più efficace. Lo standard, presentato a settembre e basato su RSS (Really Simple Syndication), rappresenta un miglioramento del Robots Exclusion Protocol. Invece di semplici regole sì/no, gli editori possono indicare i termini d’uso e le condizioni di licenza.

È possibile inoltre impedire lo scraping dei contenuti per l’addestramento dei modelli AI, consentendo allo stesso tempo la scansione da parte dei tradizionali crawler dei motori di ricerca. Google, ad esempio, non offre un’opzione di opt out separata per AI Overview e AI Mode, quindi il blocco comporta la scomparsa dal motore di ricerca. Su questa pratica è stata avviata un’indagine dalla Commissione europea.

Tra le aziende che supportano il nuovo standard ci sono Reddit, People, Yahoo, Ziff Davis, O’Reilly Media, Medium, The Daily Beast, Quora, ADWEEK, Automattic, The Verge, USA Today e ZDNet. La probabilità di successo dello standard è aumentata rispetto all’annuncio originario perché adesso viene supportato anche da Cloudflare, Akamai e Fastly, tre noti provider che offrono servizi web fondamentali, come DNS e CDN.