Può un chatbot IA fornire risposte alle domande dei pazienti in maniera simile, se non migliore, a quella di un medico? A cercare di scoprirlo sono stati alcuni ricercatori americani che, con uno studio effettuato tramite Reddit, hanno analizzato la percezione del pubblico alle risposte di un professionista e a quelle di ChatGPT, senza svelare loro chi fosse l’interlocutore.

ChatGPT o medici: la sfida

Come spiegato nello studio pubblicato su JAMA Internal Medicine, la rapida espansione dell’assistenza sanitaria virtuale ha causato un aumento dei messaggi dei pazienti in concomitanza con l’aumento del lavoro e del burnout tra gli operatori sanitari. Gli assistenti di intelligenza artificiale (AI) potrebbero potenzialmente aiutare a creare risposte alle domande dei pazienti redigendo risposte che potrebbero essere poi riviste dai medici, occupando meno tempo a questi ultimi al fine di offrire meno stress e soddisfare al meglio le esigenze dei cittadini.

Per valutare le abilità di ChatGPT, i ricercatori hanno dunque usato un database pubblico di domande pubblicate su Reddit, per la precisione su r/AskDocs, per un totale di 195 conversazioni nel mese di ottobre 2022, nelle quali un medico verificato ha risposto ai quesiti. Dopodiché, le risposte del chatbot sono state generate inserendo la domanda in una nuova sessione tra 22 e 23 dicembre 2022. Gli utenti valutatori hanno dunque scelto la risposta “migliore” giudicandola per qualità delle informazioni ed empatia.

Il verdetto è chiaro: i valutatori hanno preferito le risposte del chatbot alle risposte dei medici nel 78,6% dei casi, preferendo la lunghezza ed esaustività delle risposte date da ChatGPT, oltre alla loro qualità generale. Ciò si traduce in una prevalenza 3,6 volte superiore di risposte di qualità buona o molto buona per il chatbot. Al contempo, la percentuale delle risposte “empatiche” o “molto empatiche” è molto più alta per l’intelligenza artificiale che per i medici.

Alla luce di tali conclusioni, i ricercatori ritengono intrigante e necessaria un’ulteriore esplorazione di questa tecnologia, il cui uso appare giustificabile in contesti clinici specifici, come l’utilizzo per redigere risposte che i medici potrebbero quindi modificare al fine di assicurare risultati di qualità ai pazienti e ridurre il burnout del medico.