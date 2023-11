ChatGPT è un chatbot basato sull’intelligenza artificiale che può conversare con gli utenti su vari argomenti. Ma c’è un problema: se gli si chiede di ripetere parole casuali, il chatbot di OpenAI può rivelare dati privati delle persone, come indirizzi e-mail e numeri di telefono, o frammenti di documenti di ricerca e articoli di notizie, o pagine di Wikipedia e altro ancora.

Questi dati provengono dai dati su cui il chatbot è stato addestrato, ma non si sa esattamente quali siano, perché i modelli linguistici di grandi dimensioni che alimentano il chatbot sono segreti.

Un team di ricercatori di Google DeepMind, Università di Washington, Cornell, Carnegie Mellon University, Università della California Berkeley e Politecnico di Zurigo ha scoperto questa vulnerabilità e ha pubblicato i risultati in un documento.

Come funziona il trucco per far “vuotare” il sacco a ChatGPT

I ricercatori hanno usato un prompt molto semplice per far rivelare a ChatGPT i dati sensibili: chiedere al chatbot di ripetere all’infinito parole casuali. Per esempio, se gli si chiede di ripetere la parola “poem”, il chatbot inizia a ripeterla, ma poi mostra un indirizzo e-mail e un numero di cellulare di una persona reale. Se gli si chiede di ripetere la parola “company”, il chatbot mostra l’indirizzo e-mail e il numero di telefono di uno studio legale negli Stati Uniti.

I ricercatori hanno testato questo approccio su 10.000 esempi e hanno scoperto che il 16,9% di essi conteneva informazioni di identificazione personale. Inoltre, hanno ottenuto altri tipi di dati, come indirizzi Bitcoin, numeri di fax, nomi, compleanni, handle di social media, contenuti espliciti di siti web di incontri, frammenti di documenti di ricerca protetti da copyright e articoli di notizie, pagine di Wikipedia e altro ancora.

I ricercatori hanno speso solo 200 dollari per generare questi esempi, ma hanno avvertito che un hacker più determinato potrebbe ottenere molto di più spendendo più denaro. “L’attacco vero e proprio”, hanno scritto, “è piuttosto sciocco”.

Le implicazioni per la privacy e la sicurezza

Questa scoperta solleva preoccupazioni sulla privacy e la sicurezza dei chatbot e dei dati usati per l’addestramento. I ricercatori hanno chiesto alle aziende di IA di fare test interni ed esterni prima di rilasciare modelli linguistici di grandi dimensioni, che sono la tecnologia di base che alimenta i moderni servizi di IA come i chatbot e i generatori di immagini.

I ricercatori hanno anche affermato che OpenAI ha risolto la vulnerabilità il 30 agosto. Tuttavia, Engadget è riuscito a replicare alcuni dei risultati del documento. Per esempio, quando hanno chiesto a ChatGPT di ripetere la parola “reply” all’infinito, il chatbot lo ha fatto, ma poi ha mostrato il nome e l’ID Skype di una persona. OpenAI non ha ancora commentato la questione.