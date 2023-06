Microsoft ha avviato i test per una nuova funzionalità di Bing Chat. Alcuni utenti nel mondo possono sfruttare il riconoscimento delle immagini del modello GPT-4 e chiedere al chatbot di identificare il soggetto/oggetto nella foto. Altre interessanti novità arriveranno nelle prossime settimane.

Bing Chat riconosce le immagini

Come è noto, il modello GPT-4 di OpenAI è multimodale, quindi anche Bing Chat (che usa una versione custom di GPT-4) supporta diversi tipi di input. Oltre che testo e voce, l’utente può usare un’immagine e chiedere al chatbot di descrivere il contenuto. Il test è attualmente in corso. I più fortunati vedranno una nuova icona nel campo di testo, accanto a quella del microfono.

Cliccando sull’icona è possibile caricare l’immagine. Nell’esempio condiviso su Twitter da un utente, Bing Chat riconosce il Tempio di Edfu in Egitto:

Oh, how cool is that! Just noticed that I have access to #Bing chat's image features! @MParakhin reading German text from images needs some work. ☺️ #ai pic.twitter.com/04JfV66PAL — Karsten Lehmann (@Klehmann79) June 23, 2023

Mikhail Parakhin, responsabile del gruppo Advertising and Web Services di Microsoft, ha confermato l’avvio dei test per il 10% circa degli utenti desktop. La nuova funzionalità sarà disponibile per tutti nelle prossime settimane (anche su Android e iOS). Questa importante novità verrà inclusa anche in Windows Copilot.

Un altro utente ha caricato lo screenshot dell’equazione di Schrodinger che il chatbot ha riconosciuto perfettamente, fornendo anche una descrizione dettagliata:

Testing the Bing Vision/GPT-4 Vision

Input: A image of the “Schrödinger equation” Bing: https://t.co/vsSUdHe26q pic.twitter.com/9WfZHbwcG4 — 𝑨𝒓𝒕𝒊𝒇𝒊𝒄𝒊𝒂𝒍 𝑮𝒖𝒚 (@artificialguybr) June 21, 2023

Il dirigente dell’azienda di Redmond ha inoltre annunciato l’avvio dei test per la funzionalità che consente a Bing di “leggere” documenti di lunghezza arbitraria. Il test relativo al supporto per altri browser (al momento è possibile usare solo Edge) è stato invece temporaneamente sospeso per risolvere alcuni bug, soprattutto con Safari.