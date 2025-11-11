Wikipedia ha presentato un piano semplice per garantire la sopravvivenza del suo sito nell’era dell’intelligenza artificiale. Chi vuole i suoi contenuti, deve pagarli. L’alternativa implicita è chiara, per chi continua a fare scraping selvaggio, prima o poi ci saranno conseguenze.

Wikipedia chiede alle aziende AI di pagare per i contenuti, basta scraping

In un post sul blog, la Wikimedia Foundation, l’organizzazione che gestisce la popolare enciclopedia online, ha invitato gli sviluppatori di AI a usare i suoi contenuti in modo “responsabile”. Cioè di attribuite correttamente i contributi degli editori umani e, soprattutto, accedere ai contenuti tramite il prodotto a pagamento dell’organizzazione, la piattaforma Wikimedia Enterprise.

È un messaggio educato, ma fermo. Wikipedia ha capito che è seduta su una miniera d’oro di dati puliti, ben organizzati e verificati da esseri umani, esattamente il tipo di contenuti che le aziende di AI bramano per addestrare i loro modelli.

Il prodotto a pagamento, disponibile su richiesta, permette alle aziende di usare i contenuti di Wikipedia su larga scala senza sovraccaricare i server dell’organizzazione. In questo modo, le aziende di AI sostengono anche la missione non-profit dell’organizzazione. Perché Wikipedia, ricordiamolo, sopravvive grazie a donazioni e al lavoro volontario di migliaia di contributori. Non ha pubblicità, non ha investitori, non ha un modello di business tradizionale. È uno dei pochi angoli di Internet che sono rimasti no-profit.

E ora si trova nella posizione paradossale di vedere il suo traffico crollare proprio mentre i suoi contenuti diventano più preziosi che mai per le aziende di AI.

I bot che fingono di essere umani

Sebbene il post non arrivi al punto di minacciare sanzioni o azioni legali per chi usa il materiale tramite scraping, Wikipedia ha recentemente scoperto che i bot AI facevano scraping del sito cercando di apparire umani.

Dopo aver aggiornato i propri sistemi di rilevamento dei bot, l’organizzazione ha scoperto che il traffico insolitamente elevato registrato a maggio e giugno proveniva da bot che cercavano di eludere il rilevamento. Nel frattempo, la visualizzazione delle pagine da parte degli esseri umani erano diminuite dell’8% rispetto all’anno precedente.

È un problema serio. Più le persone ottengono informazioni tramite riassunti AI invece che visitando Wikipedia direttamente, meno traffico riceve il sito, meno utenti vedono i banner per le donazioni, meno persone decidono di fare i contributori volontari. È un circolo vizioso che potrebbe minare le fondamenta stesse dell’enciclopedia collaborativa più grande del mondo.

Le linee guida che le aziende AI dovrebbero seguire

Come si legge nel post di Wikipedia: Affinché le persone possano fidarsi delle informazioni condivise su internet, le piattaforme dovrebbero chiarire da dove provengono le informazioni e aumentare le opportunità di visitare e partecipare a tali fonti . È un appello alla trasparenza che probabilmente cadrà nel vuoto per molte aziende AI, purtroppo.

Se il trend attuale continuasse, Wikipedia potrebbe lentamente appassire, perdere contributori, perdere donazioni, e alla fine non essere più in grado di svolgere la sua missione.

Wikipedia ha passato decenni a costruire una risorsa gratuita e aperta per l’umanità. Ha resistito alla tentazione di monetizzare con la pubblicità. Ha mantenuto i suoi contenuti accessibili a tutti. E ora questa generosità le si ritorce contro quando le aziende di AI, molte delle quali valgono miliardi di dollari, usano quei contenuti per costruire prodotti commerciali senza offrire nulla in cambio.

Wikipedia sta facendo quello che può per adattarsi all’era dell’AI senza tradire i suoi principi fondamentali. Ma alla fine dipenderà dalle aziende di AI decidere se vogliono essere partner responsabili o parassiti opportunisti. Il post è essenzialmente un invito educato a scegliere la prima opzione. Vedremo quante aziende lo faranno.