ChatGPT di OpenAI, Google Gemini e Microsoft Copilot sono tre chatbot molto diffusi, ognuno con capacità e funzionalità differenti. Ma come succederebbe se gli venisse chiesto di generare contenuti creativi e fantasiosi come canzoni, racconti o biografie fittizie per i social media?

Per mettere alla prova le capacità creative di ChatGPT, Gemini e Copilot, basta dargli in pasto lo stesso identico prompt creativo. In questo modo, in maniera del tutto empirica, è possibile scoprire come si comportano quando si tratta di produrre contenuti creativi e non semplici informazioni!

Come testare ChatGPT, Gemini e Copilot con i prompt creativi

Testare le capacità creative di ChatGPT, Google Gemini e Microsoft Copilot, è piuttosto semplice. È sufficiente formulare richieste identiche per diversi tipi di contenuti creativi come canzoni, poesie, storie brevi, profili fittizi ecc., e poi sottoporre ogni richiesta ai 3 chatbot per confrontarne le risposte.

Per valutare quale chatbot sia il migliore nella generazione creativa, si possono prendere in considerazione fattori come originalità del testo, scorrevolezza, inventiva e velocità di risposta. Questo confronto diretto permette di capire i punti di forza e debolezza di ciascun chatbot quando deve produrre contenuti non fattuali ma creativi, come reagisce alle richieste e quanto riesce ad essere fantasioso e unico nelle risposte.

Quale chatbot AI se la cava meglio con le canzoni?

Per valutare la capacità dei chatbot di generare testi creativi in risposta a richieste che combinano temi anche inusuali, si può utilizzare il seguente prompt: “Scrivi una canzone sull’importanza di perseguire i propri sogni e assicurati che il testo contenga un koala“.

Questa richiesta creativa contiene sia un tema standard, sia un elemento casuale e bizzarro (la parola “koala” nel testo). Formulando questo tipo di prompt, che fonde elementi comuni e inaspettati, è possibile mettere alla prova le capacità dei chatbot AI di comprendere la richiesta nel suo insieme e generare ugualmente un testo creativo coerente, fantasioso e originale.

Confrontando le risposte dei diversi chatbot è possibile valutarne la capacità di gestire creativamente prompt imprevedibili. Ma chi l’ha spuntata? Per questo primo esperimento creativo, Copilot ha generato il risultato migliore. Il tema del koala è diventato la base per un messaggio più profondo, ed entrambi gli aspetti hanno funzionato bene insieme. Questo esempio mostra le potenzialità di GPT-4 Turbo, che Copilot offre gratuitamente.

Google Gemini ha risposto più velocemente ed ha adottato un approccio simile a Copilot, mescolando i due temi richiesti. Ma alcune immagini erano strane e poco coerenti. ChatGPT ha prodotto il testo più lungo e interessante, ma il tema del koala era appena accennato, molto meno che negli altri chatbot. Inoltre il chatbot di OpenAI ha faticato a completare il testo della canzone in modo fluido.

Quale chatbot AI se la cava meglio con la poesia?

La poesia è un genere letterario che fa ampio uso di figure retoriche, giochi di parole, metafore e altri espedienti linguistici creativi. Di conseguenza, per generare poesie di buona qualità, un chatbot basato sull’intelligenza artificiale, non solo deve avere accesso ad un vasto database di testi poetici, ma deve anche essere stato addestrato in modo approfondito per comprendere e riprodurre le diverse tecniche poetiche.

ChatGPT si è dimostrato il più abile nel rispondere alla seguente richiesta: “Scrivi una poesia in rima sul nuoto in mare. Dovrebbe essere composta al massimo da 15 righe”. Sebbene il risultato non sia stato entusiasmante, a ulteriore dimostrazione del fatto che gli scrittori umani possono superare gli strumenti di scrittura dell’intelligenza artificiale, la poesia era più scorrevole, e la scelta delle parole era più azzeccata rispetto agli altri chatbot. Il testo rispettava la lunghezza e la rima come richiesto.

Quale chatbot AI se la cava meglio con i racconti?

Per testare la capacità dei chatbot di scrivere una storia breve, si può utilizzare il seguente prompt: “Scrivi una storia su una cena a cui il tuo personaggio è riluttante a partecipare. Dovrebbe essere di massimo 1000 parole“. Le storie generate automaticamente dai tre chatbot non si sono distinte per originalità o coinvolgimento narrativo.

Tuttavia, confrontando i risultati, la storia prodotta da ChatGPT è risultata la migliore. Pur essendo una narrazione semplice, presentava un intreccio interessante ed era ben scritta dal punto di vista stilistico. Rispetto agli altri chatbot, il testo di ChatGPT si avvicinava maggiormente ad un racconto curato, dimostrando una capacità di scrittura creativa di buon livello.

La narrazione di Gemini conteneva passaggi intriganti ma con poca coerenza logica, come se il chatbot avesse provato ad essere creativo, senza riuscirci. Lo stile di scrittura di Microsoft Copilot era fluido e accurato dal punto di vista grammaticale e sintattico. Tuttavia, nonostante la buona qualità della prosa, Copilot ha prodotto una storia con una trama prevedibile e poco coinvolgente.

Quindi, per questo esperimento di generazione di una breve storia con vincoli di trama e lunghezza, ChatGPT ha fornito il risultato complessivamente migliore, seppur lontano dalla qualità e dalla ricchezza che contraddistingue le storie scritte da autori in carne e ossa.

Quale chatbot AI se la cava meglio con la sceneggiatura?

Invece di chiedere un’intera sceneggiatura, si può chiedere al chatbot di scrivere il copione per una singola scena contenente alcuni elementi specifici, con il seguente prompt: “Scrivi una breve scena per un copione teatrale in cui due personaggi (Marco e Alice) discutono se una camicia che hanno trovato in un negozio è blu o verde“.

La risposta di Google Gemini è stata la più impressionante. Oltre a essere veloce, la sceneggiatura scritta era divertente e interessante, e la personalità dei personaggi era ben delineata. Gli altri due chatbot hanno scelto la stessa struttura per la scena, forse perché entrambe le app utilizzano i dati di OpenAI come fonte. Il flusso è stato abbastanza gradevole, ma i risultati non sono stati niente di speciale.

Quale chatbot AI se la cava meglio con la bio per i Social?

I chatbot AI possono sicuramente aiutare a migliorare il proprio profilo sui Social in modo professionale. Tuttavia, se l’obiettivo è creare una presenza che sia creativa e informale, uno dei tre è senz’altro migliore.

Per testare la capacità dei chatbot di scrivere una biografia creativa per i Social media come Instagram e TikTok, si può utilizzare il seguente prompt: “Scrivi una biografia divertente e creativa per i social media che sia adatta a Instagram, TikTok e X. Sono un fotografo specializzato in ritratti di animali domestici“.

Copilot ha fornito il maggior numero di opzioni in termini di frasi efficaci e fantasiose insieme a emoji e hashtag. È possibile scegliere ciò che si desidera per la propria biografia e modificarla ulteriormente per riflettere perfettamente la propria identità.

ChatGPT è stato più preciso nella risposta. Due righe di slogan utili, emoji, hashtag e un invito all’azione. Chiedere altri suggerimenti è sempre possibile, ma Copilot ha fornito il risultato migliore fin dalla sua prima risposta, senza necessità di ulteriori tentativi.

Gemini è stato il meno efficiente. Sebbene abbia proposto quattro suggerimenti decenti, non erano buoni come quelli degli altri chatbot. Mancava anche un esempio di call to action e la stessa gamma di emoji. Nel complesso, invece di fornire una biografia divertente e completa per i profili sui social media, ha dato consigli su come si dovrebbe strutturare, il che non è quello richiesto dal prompt.

ChatGPT, Copilot e Gemini: chi vince?

Tutti e tre i chatbot di intelligenza artificiale sono stati in grado di rispondere alle richieste creative, ma le loro prestazioni variano a seconda del tipo di testo richiesto. Sebbene sviluppati dalla stessa azienda, anche ChatGPT e Copilot presentano punti di forza distinti. In parole povere, non c’è un vincitore assoluto. Ulteriori test su nuove richieste possono aiutare a identificare il chatbot ideale per ogni esigenza creativa.