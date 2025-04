Google si tuffa nel mondo dei delfini con DolphinGemma, un nuovo modello AI creato per aiutare gli scienziati a studiare come comunicano questi affascinanti mammiferi marini. L’obiettivo? Scoprire cosa si dicono, ovviamente!

DolphinGemma, il modello AI di Google studia la comunicazione dei delfini

Per sviluppare DolphinGemma, Google ha unito le forze con i ricercatori del Georgia Tech e del Wild Dolphin Project (WDP). Il WDP ha una missione ben precisa: osservare, documentare e riportare i comportamenti naturali, le strutture sociali, i modelli di comunicazione e gli habitat dei delfini selvatici, in particolare il tursiope a macchie atlantiche (Stenella frontalis), attraverso una ricerca sul campo non invasiva e a lungo termine.

Negli anni, il WDP ha raccolto dati che permettono di correlare determinati suoni a specifici comportamenti. Ad esempio:

Fischi firma (nomi unici) usati da madri e cuccioli per ritrovarsi;

Squittii a impulsi spesso associati a momenti di tensione e conflitto;

Clic usati per l’ecolocalizzazione, ma anche durante il corteggiamento o l’inseguimento di squali.

Come funziona DolphinGemma?

Il sistema è stato sviluppato sul dataset del WDP, che usa il tokenizer SoundStream di Google per scomporre le vocalizzazioni dei delfini in unità audio più gestibili. Queste unità vengono poi elaborate attraverso un’architettura di modello specializzata, progettata per dare un senso a sequenze complesse. L’intero setup conta circa 400 milioni di parametri, il che lo rende abbastanza leggero da funzionare nativamente sui Pixel, che i ricercatori del WDP portano con sé sul campo.

A differenza dei modelli di machine learning tradizionali, DolphinGemma non lavora con parole o immagini, ma solo con l’audio. Prende in input sequenze di vocalizzazioni naturali dei delfini, le elabora usando un approccio ispirato a come gli LLM capiscono il linguaggio umano e prevede il suono più probabile nella sequenza successiva. Il sistema è addestrato a identificare schemi, strutture e progressioni in questi suoni, proprio come un modello basato su testo prevede la parola successiva in una frase in base al contesto.

CHAT: il precursore di DolphinGemma

Prima che Google arrivasse con DolphinGemma, il team di ricercatori del WDP usava CHAT per esplorare la possibilità di una comunicazione bidirezionale con i delfini. L’obiettivo di CHAT non era decifrare tutta la complessità del linguaggio dei delfini, ma costruire un vocabolario condiviso più semplice per interagire con loro.

Il sistema funziona associando nuovi fischi sintetici, creati da CHAT, a oggetti specifici che i delfini sembrano apprezzare, come sargassi, alghe marine o anche sciarpe usate dai ricercatori. La speranza era che, associando ripetutamente questi fischi sintetici agli oggetti, i delfini iniziassero a imitare i suoni per “chiedere” quegli oggetti.

CHAT girava su un Google Pixel 6, che gestiva l’analisi audio di alta qualità in tempo reale. Prossimamente, i ricercatori passeranno al Pixel 9, che offre altoparlanti e microfoni migliori, e ha abbastanza potenza per eseguire modelli di deep learning e pattern matching allo stesso tempo.

DolphinGemma: un modello aperto per svelare i segreti dei delfini

Google afferma che renderà DolphinGemma un modello aperto questa estate, nella speranza di “dare ai ricercatori di tutto il mondo gli strumenti per esplorare i propri dataset acustici, accelerare la ricerca di schemi e approfondire collettivamente la nostra comprensione di questi mammiferi marini intelligenti“.