Deloitte, uno dei giganti globali della consulenza, si è trovata a dover rimborsare parte di un contratto da 440.000 dollari australiani (circa 290.000 USD) dopo che il governo australiano ha scoperto che il report commissionato era pieno di citazioni inventate, ricercatori inesistenti e riferimenti a sentenze giudiziarie totalmente false. Il documento di 273 pagine era stato generato parzialmente usando Azure OpenAI GPT-4o, e nessuno in Deloitte si era preoccupato di verificare se le “fonti” citate dall’AI esistessero davvero. Spoiler: molte non esistevano.

Scandalo Deloitte: AI genera report falso, deve rimborsare il governo

Il “Targeted Compliance Framework Assurance Review“, commissionato dal Department of Employment and Workplace Relations australiano, doveva essere un’analisi tecnica seria sull’automazione delle sanzioni nel sistema di welfare. Un documento importante, pagato profumatamente dai contribuenti, che avrebbe dovuto riflettere l’esperienza e la competenza di Deloitte. In realtà, però, gran parte del lavoro non è stata svolta da esperti umani, ma da GPT-4o di OpenAI, che ha fatto quello che le AI sanno fanno meglio: inventare cose con assoluta sicurezza.

Appena pubblicato, degli accademici australiani hanno iniziato a notare anomalie. Citazioni attribuite a ricercatori che non esistono. Studi che nessuno riesce a trovare. Riferimenti a decisioni giudiziarie completamente inventate. La professoressa Lisa Burton Crawford, giurista riconosciuta, ha scoperto dei passaggi attribuiti a lei basati su rapporti che non ha mai pubblicato.

Deloitte ha ammesso l’uso dell’intelligenza artificiale generativa solo a pagina 58 di un nuovo documento rielaborato e pubblicato a fine settembre. Non nell’introduzione, non nelle note metodologiche, ma sepolta in profondità nel testo dove pochi l’avrebbero notata. Delle 141 fonti elencate originalmente, 14 sono sparite nella versione rivista, eliminate perché… inesistenti. Un tasso di errore del 10% sulle fonti in un report professionale pagato centinaia di migliaia di dollari.

L’azienda non aveva mai informato il cliente o le istituzioni accademiche che avrebbe affidato a un’AI il compito di analizzare processi tecnici complessi. Una scelta che sarebbe stata problematica anche se l’AI avesse prodotto contenuti accurati, ma che diventa inaccettabile quando il risultato è pieno di allucinazioni presentate come fatti verificati.

Il rimborso forzato e la reputazione danneggiata

Di fronte alla gravità dei fatti, Deloitte ha dovuto accettare di rimborsare l’ultima tranche del contratto, anche se la proporzione esatta non è stata specificata. Il governo sostiene che il contenuto sostanziale del report e le sue raccomandazioni restano invariati. Gli esperti universitari perrò esprimono forti riserve, comprensibilmente scettici su quanto ci si possa fidare di un documento dove il 10% delle fonti è letteralmente inventato.

La frittata per Deloitte oramai è fatta. Non si tratta solo di aver usato l’AI, molti cabinet di consulenza stanno sperimentando questi strumenti. Ma di averlo fatto senza verificare l’accuratezza dei dati, e senza informare il cliente, soprattutto.

Le allucinazioni dell’AI che diventano problemi reali

Questo scandalo dimostra quali sono i limiti e i pericoli dell’intelligenza artificiale quando viene usata senza controlli appropriati. Le famose “allucinazioni“, la tendenza a inventare informazioni con la stessa sicurezza con cui presentano fatti veri, sono un problema noto. GPT-4o e altri modelli possono generare testo convincente su qualsiasi argomento, completo di citazioni che sembrano legittime ma che sono inventate di sana pianta. E non è un caso isolato.

La lezione dovrebbe essere ovvia: l’intelligenza artificiale può essere uno strumento utile, ma richiede una supervisione umana rigorosa. Ogni citazione va verificata. Ogni riferimento va controllato. Ogni affermazione va validata. Usare l’AI per generare contenuto e pubblicarlo senza controlli adeguati non è efficienza, è negligenza professionale. Punto.