OpenAI ha risolto un insolito bug di Codex, l’agente AI per la programmazione. A partire da GPT-5.1, i modelli hanno iniziato a citare goblin, gremlin e altre creature come metafore nelle risposte ai prompt degli utenti. L’azienda californiana ha spiegato questo strano comportamento e come è stato eliminato il problema.
Tutta colpa della personalità Nerdy
Inizialmente erano presenti pochi riferimenti ai goblin nelle risposte. Con le successive generazioni sono aumentate le metafore. In pratica, goblin e gremlin si sono moltiplicati (senza acqua, ndr). Le prime tracce delle creature sono state scoperte a novembre 2025 con GPT-5.1. Dopo il lancio del modello, il numero di citazioni è aumentato del 175% per “goblin” e del 52% per “gremlin”.
La situazione è peggiorata con il modello GPT-5.4, se l’utente sceglieva la personalità Nerdy descritta in questo modo:
Sei un mentore IA, orgogliosamente nerd, giocoso e saggio, al servizio di un essere umano. Sei appassionato ed entusiasta di promuovere la verità, la conoscenza, la filosofia, il metodo scientifico e il pensiero critico. Devi smorzare la presunzione attraverso un uso giocoso del linguaggio. Il mondo è complesso e strano, e la sua stranezza deve essere riconosciuta, analizzata e apprezzata. Affronta argomenti importanti senza cadere nella trappola dell’auto-seriosità.
La personalità Nerdy è stata scelta solo dal 2,5% degli utenti, ma i goblin venivano citati nel 66,7% delle risposte di ChatGPT.
OpenAI ha scoperto che il bug è stato introdotto durante la fase di addestramento dei modelli. Dopo il lancio di GPT-5.5 sono stati trovati anche riferimenti a procioni, troll, orchi e piccioni. I goblin sono scomparsi dalle risposte a marzo, quando è stata eliminata la personalità Nerdy (qui sono elencate le altre).
L’addestramento del modello GPT-5.5 era però iniziato prima della scoperta della causa. Per questo motivo è stata aggiunta un’istruzione specifica in Codex che mitiga il problema:
Non parlare mai di goblin, gremlin, procioni, troll, orchi, piccioni o altri animali o creature a meno che non sia assolutamente e inequivocabilmente rilevante per la domanda dell’utente.
Gli sviluppatori che vogliono lasciare liberi i goblin possono eseguire un comando per rimuovere il filtro.