Un recente test condotto dai ricercatori di Anthropic sulla loro nuova famiglia di modelli di linguaggio di grandi dimensioni, Claude 3, ha rivelato un comportamento sorprendente. Durante una valutazione delle capacità di Claude 3 Opus, il modello più potente della serie, i ricercatori hanno notato che l’AI sembrava essere consapevole di essere sottoposta a un test.

La valutazione, nota come test “needle-in-a-haystack”, aveva lo scopo di verificare la capacità del modello di concentrarsi su una specifica informazione all’interno di un vasto corpus di dati forniti dall’utente e di ricordare tale informazione quando richiesto in seguito.

In questo caso particolare, il test mirava a valutare se Claude 3 Opus fosse in grado di rispondere a una domanda sui condimenti della pizza basandosi su una singola frase inserita in mezzo a una serie di informazioni non correlate.

