DeepMind , la divisione di Google che si occupa di intelligenza artificiale, ha scalato un altro gradino verso la creazione di un’AI che sia sempre più simile a quella umana. Dopo aver imparato a giocare con una serie di vecchi titoli Atari ed aver battuto il campione mondiale di GO , adesso il sistema ha imparato a giocare anche al terribile Montezumàs Revenge.
Pochi mesi fa l’impresa era sembrata impossibile, visto che DeepMind aveva totalizzato 0 (zero) punti nel gioco. Cosa è cambiato da allora? Semplice: è cambiato l’approccio al problema. Il precedente algoritmo dopo una serie di tentativi di esplorazione del mondo di Montezumàs Revenge sembrava essersi annoiato . Il nuovo algoritmo, invece, mutua nell’AI un elemento fondamentale per l’apprendimento umano: la motivazione intrinseca , o Intrinsic Rewards .
Grazie ad essa il soggetto si impegna in un’attività perché da questa trae stimoli e gratificazioni personali. In DeepMind, l’intelligenza artificiale è stata unita ad un sistema di stimoli e incentivi che permettono di creare una sorta di curiosità artificiale che rende la AI desiderosa di completare il gioco, oltre che molto più veloce nell’apprendere le strategie migliori per risolvere gli enigmi. Tutto questo ha permesso a DeepMind di esplorare 15 delle 24 stanze virtuali del gioco nello stesso lasso di tempo in cui la versione precedente dell’algoritmo era riuscita ad esplorare due sole stanze.
Il prossimo obiettivo degli sviluppatori di DeepMind è ora quello di creare nuovi modelli in grado di permettere al sistema di affrontare giochi ancora più difficili e, magari, poter poi competere direttamente con gli esseri umani. Questo porterebbe ad avere giochi estremamente più intriganti perché la AI imparerebbe dai propri errori e sarebbe in grado di capire la tattica dell’avversario molto meglio di quanto non avvenga oggi.
Ma gli sviluppi di un tale approccio non si limitano al mondo dei videogiochi: Google potrebbe proficuamente utilizzare la AI di DeepMind per migliorare altri suoi servizi. Ad esempio realizzando sistemi di guida automatica più avanzata per le sue auto senza pilota, oppure robot in grado di imparare semplici task (almeno inizialmente) osservando l’uomo.
Fiore Perrone