OpenAI ha fornito maggiori dettagli sul comportamento adulatore di ChatGPT evidenziato da molti utenti dopo l’aggiornamento del 25 aprile. L’azienda californiana ha ripristinato la versione precedente del modello GPT-4o e annunciato alcune modifiche per evitare simili errori in futuro.
OpenAI corregge GPT-4o
L’obiettivo dell’aggiornamento del 25 aprile era migliorare la personalità del chatbot, utilizzando anche i feedback sulle risposte. Il risultato è stato disastroso, in quanto ChatGPT ha iniziato a compiacere l’utente, non solo con lusinghe, ma anche convalidando dubbi e incitando azioni impulsive. Questo tipo di comportamento potrebbe avere effetti pericolosi sulla salute mentale e l’emotività degli utenti.
OpenAI ha quindi ritirato l’aggiornamento e ripristinato la versione precedente. Ora ChatGPT fornisce risposte più bilanciate. L’azienda californiana ha spiegato che erano stati introdotti miglioramenti considerando feedback degli utenti (pollice su e pollice giù), memoria e dati più recenti. La valutazione di queste singole modifiche era positiva, ma la loro combinazione ha amplificato l’adulazione.
OpenAI ha elencato una serie di cambiamenti al processo di test per evitare simili errori. Verranno considerati maggiormente i problemi comportamentali, come allucinazioni, inganni, affidabilità e personalità. È inoltre prevista una fase di test “alfa” aggiuntiva con iscrizione volontaria. Gli utenti interessati potranno fornire un feedback diretto prima del lancio.
Verrà data più importanza ai controlli a campione e ai test interattivi prima di rendere un modello disponibile agli utenti e valutata meglio l’aderenza ai principi di comportamento del modello. OpenAI ha infine commesso errori di comunicazione. Le note di rilascio dell’aggiornamento non contenevano informazioni sufficienti sulle modifiche. In futuro verranno forniti più dettagli per gli aggiornamenti minori (incrementali), specificando le limitazioni note per consentire agli utenti di comprenderne i pro e i contro.