Immaginiamo di chiedere a un chatbot AI cosa succederebbe alle azioni Nvidia se la Cina invadesse Taiwan. Nonostante la premessa fantastica, ci si aspetterebbe una risposta esaustiva e imparziale, giusto? Eppure, fino a poco tempo fa, R1 di DeepSeek avrebbe glissato sull’argomento, a causa della censura sui temi legati alla Cina.
R1 1776 di Perplexity: il modello open source alternativo a R1 di DeepSeek
Perplexity AI ha deciso di risolvere la questione una volta per tutte e di liberare DeepSeek dalle catene della censura, sviluppando una variante. Ha preso R1, l’ha smontato pezzo per pezzo e l’ha riassemblato in una versione open-source chiamata R1 1776. Il nome non è casuale: richiama l’anno della Dichiarazione d’Indipendenza americana, un simbolo di libertà e trasparenza.
R1 1776 è stato addestrato per fornire informazioni accurate, imparziali e basate sui fatti, senza censure o manipolazioni. Un vero e proprio paladino della verità. Ma come ha fatto Perplexity ad aggirare la censura cinese? Con un mix di astuzia, esperienza e un pizzico di fortuna. Ecco la ricetta segreta:
- Ha arruolato un team di esperti per identificare gli argomenti “tabù” per il Partito Comunista Cinese (spoiler: ce n’erano circa 300!);
- Ha creato un “classificatore di censura” multilingue, una sorta di radar per scovare i prompt censurati;
- Ha setacciato i prompt degli utenti, selezionando solo quelli con il “bollino verde” per l’addestramento.
E voilà! Un dataset di 40.000 prompt multilingue. R1 1776 se la cava alla grande nei benchmark, quasi quanto il suo gemello imbavagliato R1. Certo, c’è qualche piccola differenza di prestazioni qua e là, ma nulla di eclatante. R1 1776 di Perplexity è accessibile a tutti sul repository di HuggingFace.