Come ti frego il filtro su YouTube

Come ti frego il filtro su YouTube

Un utente del portale di videocondivisione ha fatto qualche esperimento sull'upload di brani musicali, scoprendo alcune importanti peculiarità sulla tecnologia di filtering adottata da GoogleTube
Un utente del portale di videocondivisione ha fatto qualche esperimento sull'upload di brani musicali, scoprendo alcune importanti peculiarità sulla tecnologia di filtering adottata da GoogleTube

YouTube ha deciso di usare la mannaia con i contenuti musicali infilati sui suoi server senza l’autorizzazione degli aventi diritto. Ma quella stessa mannaia che silenzia le canzoni famose si presta a qualche controindicazione che un intraprendente uploader del portale ha scovato dopo aver condotto un po’ di esperimenti, modificando di volta in volta le caratteristiche della stessa canzone per verificare il risultato finale del filtering di GoogleTube .

L’utente suddetto è tale retnirpregnif , e la canzone scelta per l’impresa è “I Know What Boys Like” dei The Waitresses , modificata e riversata sui server di Google in 82 versioni differenti nel tempo di ascolto, nel tono, nel livello di amplificazione e di rumore e altro ancora. L’ analisi di retnirpregnif ha permesso di evidenziale la notevole sofisticazione ed efficienza del sistema di identificazione dei contenuti di YouTube, ma anche la sua vulnerabilità a qualche trucco in fondo banale e alla portata di chiunque.

Delle 82 clip immesse online, il filtro del portale (basato sul software sviluppato da Audible Magic ) ne ha individuate 35: nonostante questo l’account non è stato chiuso . Il filtro di identificazione “è dappertutto”, dice retnirpregnif , scansiona ogni singolo video di cui viene fatto l’upload o che si trovi già online prima della sua installazione: non importa il titolo o la descrizione e bastano in genere pochi minuti perché il sistema scatti inesorabile e scandagli l’audio delle clip.

Content ID di YouTube è poi “flessibile”: nei test di amplificazione il brano è stato individuato anche con un livello di rumore del 45% (comunque non oltre). Inascoltabile per l’utente ma non per il filtro che riesce persino a “resistere” a un cambiamento di tono e tempo sino al 5% rispetto ai valori originali.

Si tratta insomma di un sistema molto sofisticato, che tra i pochi punti deboli ha il fatto di risultare inefficace nel caso in cui i primi 30 secondi della clip siano puro silenzio : a quel punto il resto del brano non viene analizzato e il filtro darebbe per scontato che non ci sia niente di significativo da segnalare o taggare come non autorizzato. “Non so se tutti i sample nel database di contenuti sono affetti da simili debolezze – dice retnirpregnif – ma sicuramente si tratta di qualcosa che merita un ulteriore approfondimento”.

Alfonso Maruccia

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il 28 apr 2009
Link copiato negli appunti