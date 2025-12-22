I gestori di Anna’s Archive, nota “biblioteca ombra” utilizzata anche da Meta, hanno effettuato lo scraping quasi totale dei file musicali presenti nel catalogo di Spotify. Sulla rete Torrent verranno distribuite oltre 86 milioni di tracce audio per un totale di circa 300 TB.

Pirateria musicale, non preservazione della storia

L’autore del post sul blog di Anna’s Archive scrive che la missione è preservare la cultura e la conoscenza. In questo caso, lo scraping del catalogo di Spotify è stato effettuato per conservare la storia della musica moderna. In realtà è una violazione dei diritti d’autore, ovvero pirateria musicale.

Spotify ha circa 256 milioni di tracce. Anna’s Archive ha tuttavia “rubato” quelle più popolari per un totale di circa 86 milioni di tracce che rappresentano il 99,6% degli ascolti in streaming. I metadati sono invece quasi completi. È stato effettuato lo scraping del 99,9% delle informazioni sulle tracce, tra cui nome dell’artista, nome del brano, nome dell’album e altri dati.

I metadati sono stati già condivisi sulla rete Torrent. Si tratta di due database SQLite in formato compresso. La dimensione di quello principale (artisti, album e tracce) è circa 200 GB, mentre quello secondario (analisi audio) è circa 4 TB. I file musicali verranno distribuiti nei prossimi giorni (non sono inclusi quelli rilasciati dopo luglio 2025).

Per i brani più popolari è stata mantenuta la qualità originale dello streaming standard, quindi i file sono in formato OGG Vorbis a 160 kbps. Quelli meno popolari sono stati ricodificati con OGG Opus a 75 kbps. I file verranno rilasciati in formato AAC (Anna’s Archive Containers), da non confondere con il formato di codifica Advanced Audio Coding.

Quasi certamente verrà presentata una denuncia per violazione del copyright. Questo è il commento ufficiale di Spotify:

Un’indagine sull’accesso non autorizzato ha rilevato che una terza parte ha rubato metadati pubblici e utilizzato tattiche illecite per aggirare il DRM e accedere ad alcuni file audio della piattaforma. Stiamo indagando attivamente sull’incidente.

In teoria sarebbe possibile creare una versione personalizzata e gratuita di Spotify, avendo spazio di storage sufficiente (circa 300 TB) e un server di streaming, come Plex. Le tracce musicali potrebbero essere anche utilizzate per l’addestramento dei modelli AI che generano audio. In entrambi i casi è un’attività illegale.