Rosetta è l'IA che legge le immagini su Facebook

Facebook annuncia il debutto di Rosetta, un sistema basato sul machine learning in grado di interpretare il testo contenuto nelle immagini condivise.

Oltre due miliardi di utenti attivi su base mensile, la maggior parte dei quali costantemente impegnati in un’interazione incessante con gli altri utenti, in forma privata o pubblica: Facebook rappresenta oggi il social network più popolato della grande Rete, una piattaforma sulla quale ogni giorno transita un volume enorme di contenuti. Al fine di renderli rintracciabili e accessibili indipendentemente dalla lingua parlata o dal paese di provenienza, la creatura di Mark Zuckerberg ha messo a punto un nuovo sistema sviluppato ad hoc e battezzato Rosetta.

Rosetta: come funziona

L’intelligenza artificiale e il machine learning sono alla base di una tecnologia che stando al comunicato ufficiale è in grado di estrarre e riconoscere in tempo reale il testo contenuto in oltre un miliardo di immagini e frame video ogni giorno. Per dirla con altre parole, un avanzato sistema OCR (Optical Character Recognition) studiato in modo da dividere inizialmente lo spazio da analizzare nelle regioni rettangolari che includono le parole, per poi ricorrere all’impiego di una rete neurale convoluzionale al fine di decifrarne le singole lettere, proponendo così una traduzione specifica per ogni territorio. Il supporto è garantito anche per alfabeti diversi da quello latino come l’arabo e il devanagari (hindi).

La modalità impiegata da Rosetta per analizzare il testo contenuto nelle immagini

Gli algoritmi sono stati istruiti ricorrendo sia a un database di immagini contenenti annotazioni generate in modo automatico sia mediante l’intervento di personale umano. La natura stessa del sistema, basata su dinamiche di apprendimento, gli permetterà di migliorare la propria efficacia nel tempo attraverso un training continuo. Maggiori informazioni di stampo tecnico sul modello di estrazione del testo possono essere consultate sulle pagine del sito ufficiale.

La struttura del modello alla base di Rosetta

Facebook e le immagini

La centralità delle immagini nell’attività e nel business di Facebook è cosa nota, testimoniata negli anni scorsi anche dall’acquisizione di Instagram. L’IA di Rosetta è già attiva su entrambe le piattaforme con finalità ben precise: aiutare l’indicizzazione di foto, meme e altri contenuti grafici nei database affinché possano essere trovati con facilità dagli utenti, aiutare gli screen reader a interpretarne il contenuto nel nome dell’accessibilità e semplificare la comunicazione tra chi parla diverse lingue.

Nuove lingue per la traduzione

Restando in tema, il social network annuncia oggi l’ingresso di 24 nuove lingue per quanto riguarda l’elenco di quelle supportate nelle traduzioni. Tra queste serbo, bielorusso, marathi, singalese, tèlugu, nepalese, kannada, urdu, punjabi, cambogiano, pashtu, mongolo, zulu, xhosa e somalo. Al momento l’efficacia della conversione in questi idiomi è per stessa ammissione di Facebook ancora da migliorare.

Fonte: Facebook

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicato. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy

Chiudi i commenti