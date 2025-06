Quante volte sarà capitato di vedere qualcosa navigando online e pensare “Come si chiama questa pianta?” o “Dove posso comprarla?”. Per fortuna, oggi abbiamo a disposizione due strumenti incredibili che possono letteralmente “vedere” quello che stiamo guardando: Google Lens integrato in Chrome e Microsoft Copilot Vision su Edge. Ma qual è il migliore tra i due?

Entrambi promettono di riconoscere oggetti, tradurre testi e rispondere alle nostre richieste su qualsiasi cosa appaia sullo schermo. La vera domanda è: quale lo fa meglio e quale si adatta di più al proprio modo di navigare?

Riconoscimento visivo a confronto: chi vince tra Google Lens e Copilot Vision?

Google Lens esiste da anni e ormai lo conosciamo bene. Nato come app per smartphone, è stato integrato su Chrome. Basta fare un clic destro su un’immagine o un testo per attivarlo e ottenere informazioni immediate. Microsoft Copilot Vision è il nuovo arrivato e ha ambizioni più grandi. Fino al 12 giugno 2025 era limitato a Microsoft Edge, ma ora è arrivato anche su Windows 10 e 11. Per adesso funziona solo negli Stati Uniti, ma presto arriverà anche nel nostro Paese. La differenza principale? Google Lens guarda i singoli elementi, Copilot Vision cerca di capire tutta la pagina insieme.

1. Riconoscere gli oggetti, chi è il più veloce?

Per mettere alla prova Google Lens e Copilot Vision, basta fare qualche test pratico, mettendo a confronto ad esempio la foto di una camicia in chambray, un tessuto particolare spesso confuso con il denim, e quella di una pianta di Aloe condivisa su Facebook. I risultati sono interessanti. Entrambi gli strumenti, infatti, riconoscono immediatamente gli oggetti. La pianta viene identificata correttamente come Aloe Vera sia da Google Lens che da Copilot Vision.

Quando però si tratta di descrivere la camicia… Google Lens è più preciso nel riconoscimento e suggerisce link a prodotti simili. Copilot Vision invece fa una descrizione più generica, senza entrare nei dettagli né proporre articoli collegati.

Quindi, se si vuole comprare quello che si sta guardando, Google Lens è decisamente più utile. Suggerisce prodotti simili, dà link per lo shopping e indirizza verso negozi e blog per saperne di più o fare acquisti. Tutto organizzato in una pratica colonna laterale pulita e facile da navigare. Copilot Vision invece non aiuta a fare acquisti. Riconosce quello che si sta guardando e risponde alle domande, ma non dà suggerimenti su dove comprarlo, né indirizza verso fonti esterne.

2. Gestione del testo: copiare, tradurre e fare domande

Per capire come se la cavano con il testo (copiare, tradurre e rispondere a domande di approfondimento), basta provare con un PDF bilingue inglese-italiano e la scansione di un documento d’identità.

Google Lens è bravissimo con il testo. Riesce a copiarlo dalle immagini e tradurlo subito nella barra laterale. È perfetto quando si ha a che fare con documenti in lingua straniera o si vuole copiare un numero di telefono, un nome o un numero ID senza digitarlo. Inoltre, si può usare la barra laterale per esplorare risultati di ricerca, ottenere definizioni rapide o inserire altre parole chiave per cercare informazioni correlate.

Copilot Vision, come app, non permette di copiare testo e le traduzioni sono solo vocali, quindi sono si possono salvare, a differenza di Google Lens. Però è sorprendentemente più bravo nelle interazioni in tempo reale con il testo. Ad esempio, se si mostra il documento capovolto, non solo riconosce il problema, ma consiglia anche di girarlo e ingrandirlo.

Se si hanno domande sul testo che si sta leggendo, Copilot Vision può rispondere a qualsiasi curiosità. L’unico limite è che tutto avviene tramite chat: si fanno le domande e si ricevono risposte scritte sullo schermo.

L’aggiornamento di giugno di Copilot Vision dovrebbe rimescolare un po’ le carte in tavola. Microsoft ha aggiunto “Highlights“, una funzione che assomiglia molto alla barra laterale dei risultati di Google Lens. Ma Highlights dovrebbe avere qualche asso nella manica in più. Può scovare informazioni utili da tutto quello che si ha sul tuo PC: app, browser, documenti. La cosa interessante è che non si dovrà nemmeno chiedere aiuto. Copilot Vision dovrebbe suggerire automaticamente azioni e file in base a quello che si sta facendo. Una sorta di sistema predittivo. Peccato che per ora funzioni solo negli Stati Uniti.

3. Analisi di pagine web e PDF

Quando si passa a contenuti più complessi, le differenze tra i due strumenti diventano evidenti. Testando entrambi su un articolo lungo di giornale e una pagina di prodotto Amazon, emerge chiaramente un vincitore. Google Lens si concentra su elementi specifici: si clicca su un testo o un’immagine e si ottengono informazioni su quello. Non riesce però a comprendere il senso generale di una pagina intera. In un articolo lungo, può riconoscere il titolo o una foto, ma non riesce a cogliere il senso generale del discorso.

Copilot Vision funziona diversamente. Legge tutto contemporaneamente e può rispondere a domande sul contenuto generale del documento. Può individuare le citazioni importanti e persino riassumere i punti chiave. Anche se a volte rallenta con i file pesanti, è chiaramente progettato per capire il contesto nell’insieme.

Su una pagina di shopping online, per esempio, Copilot Vision può spiegare le differenze tra prodotti simili, riassumere cosa dicono le recensioni e persino fornire statistiche sui prezzi. Google Lens invece riesce solo a riconoscere singoli elementi come il logo del brand o il prezzo.

Google Lens Vs Copilot Vision, quale scegliere?

Google Lens e Microsoft Copilot Vision sono entrambi strumenti validi, ma hanno filosofie completamente diverse. Non esiste lo strumento migliore in assoluto: tutto dipende dall’uso che se ne fa.

Google Lens eccelle nelle operazioni rapide. Può identificare oggetti, copiare testi, tradurre scritte al volo. L’interfaccia è pensata per dare risposte immediate senza troppi passaggi. È ideale per ottenere risposte rapide su quello che si vede mentre si naviga. Copilot Vision è progettato per l’analisi. Funziona meglio quando serve comprendere contenuti lunghi, fare confronti o ottenere spiegazioni articolate. Inoltre, l’approccio conversazionale permette di approfondire argomenti complessi attraverso domande e risposte.