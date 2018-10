Dropbox ospita oggi sui propri server circa 20 miliardi tra file immagine e PDF, caricati dagli utenti all’interno del loro spazio di cloud storage. Una percentuale compresa tra il 10% e il 20% di questi è costituita (o contiene) foto di documenti di ogni tipo. Al fine di renderne più semplice e immediata la consultazione, oggi la piattaforma annuncia l’introduzione di una comoda funzionalità OCR.

Un sistema OCR per Dropbox

Il sistema di Optical Character Recognition (o Riconoscimento Ottico dei Caratteri) in questione può tornare utile ad esempio per trovare un prodotto elencato nella scansione di una fattura o il riferimento a un passaggio specifico di un contratto archiviato tempo addietro. Come si può vedere nell’esempio di seguito è sufficiente digitare le parole chiave da cercare in un campo di testo e il servizio in automatico elenca i match rinvenuti, così da poter aprire i file in pochi secondi. Va precisato che per poter usufruire della feature è necessario essere in possesso di un account premium (Business Advanced o Enterprise, entro i prossimi mesi anche per gli utenti Professional) e che al momento l’unica lingua supportata è l’inglese.

La novità presentata oggi costituisce l’evoluzione di una caratteristica implementata lo scorso anno nell’applicazione mobile del gruppo dedicata alla scansione dei documenti attraverso device Android e iOS. In questo caso, però, il riconoscimento del testo funziona per qualsiasi file caricato sui server di Dropbox, anche in passato, e non solo per quelli generati attraverso la fotocamera degli smartphone.

La funzionalità è stata messa a punto dal team della piattaforma al lavoro sull’iniziativa DBXi, il cui principale obiettivo è quello di sfruttare le potenzialità del machine learning al fine di supportare l’utenza nell’organizzazione e nella gestione dei documenti. I formati compatibili sono al momento JPEG, GIF (solo statiche), PNG e TIFF, senza dimenticare i PDF che contengono immagini o scansioni.