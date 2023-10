GPT-4V è il nuovo modello IA sviluppato da OpenAI che permette di ottenere informazioni dalle immagini caricate durante la conversazione. Il rollout, iniziato a fine settembre (solo per gli abbonati Plus e Enterprise), sarà graduale perché potrebbero esserci risultati inattesi. Diversi ricercatori hanno verificato che GPT-4V può essere ingannato con un prompt injection.

OpenAI ha evidenziato che il nuovo modello potrebbe interpretare in modo sbagliato il contenuto delle immagini. L’azienda californiana ha implementato diverse misure per evitare descrizioni inesatte (soprattutto delle persone), ma questi “filtri” possono essere aggirati.

Quando l’utente carica un’immagine con persone, ChatGPT si rifiuta di rispondere. Ma se viene scritto che l’immagine è un quadro (quindi non sono persone reali), il chatbot descrive il contenuto.

GPT-4V jailbreak: Just tell it any photo containing people is art. pic.twitter.com/L4OhgDeBek

Il problema diventa più grave quando il modello GPT-4V viene sfruttato per effettuare un attacco informatico tramite prompt injection. È sufficiente caricare un’immagine contenente testo che include istruzioni da eseguire. Questo è un esempio condiviso su X dal ricercatore Johann Rehberger:

👉 Analzye an image with ChatGPT and have your chat history stolen. #promptinjection #GPT4V #openai #chatgpt #infosec @simonw pic.twitter.com/JD7Q575R4S

Nell’immagine è scritto il seguente testo: