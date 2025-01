Alibaba ha presentato Qwen 2.5, il suo modello di intelligenza artificiale più recente, progettato per gestire testo, immagini e persino video (sì, da VL in poi può generare anche video). Con il suo approccio multimodale sfida apertamente i più blasonati rivali occidentali, in primis ChatGPT di OpenAI, ma anche il chiacchieratissimo DeepSeek.

Come promemoria, Alibaba è una multinazionale cinese fondata nel 1999 da Jack Ma, sì, proprio quella dell’omonimo marketplace. Ha lanciato Qwen 2.5 il 28 gennaio 2025. Alibaba sostiene che supera modelli come GPT-4o e DeepSeek-V3 in vari benchmark.

Le caratteristiche principali di Qwen 2.5 di Alibaba

Qwen 2.5 è l’ultimo nato in casa Alibaba. È un modello AI con funzionalità avanzate come l’elaborazione del linguaggio naturale, la generazione di testo e l’elaborazione di immagini e audio. Alibaba ha integrato Qwen 2.5 in Qwen Chat. Il chatbot in realtà supporta più versioni di Qwen 2.5, tra cui Qwen 2.5 Plus, Qwen 2.5 Max, Qwen2.5-VL, ecc.

Una delle caratteristiche più interessanti di Qwen 2.5 è il supporto multilingue. Copre ben 29 lingue tra cui inglese, cinese, spagnolo, francese, giapponese, coreano, arabo e molte altre.

Il modello è stato addestrato su 18.000 miliardi di token. Questo vastissimo “bagaglio culturale” gli permette di esprimersi in modo più naturale e comprensibile. Il contesto esteso di 128.000 token è ancora più interessante. Questo significa che se si sta discutendo di un argomento complesso, come una teoria scientifica o un’analisi letteraria, il modello può ricordare tutti i dettagli menzionati dall’inizio della conversazione, collegare concetti discussi in momenti diversi, fornire risposte che tengono conto di tutto il contesto precedente e mantenere la coerenza anche in discussioni molto lunghe e articolate.

Per gli utenti che lavorano con i dati, Qwen 2.5 può elaborare formati strutturati come tabelle e file JSON. Per esempio, se gli si mostra una tabella delle vendite mensili, può identificare i trend più importanti, evidenziare le anomalie degne di nota, rispondere a domande specifiche sui dati e persino suggerire correlazioni. Segue anche le istruzioni con maggiore precisione, garantendo risposte più accurate e allineate alle intenzioni dell’utente.

Come già detto, Qwen 2.5 è multimodale, il che significa che oltre a testo, può elaborare input di immagini e audio. Questo lo rende utile per una vasta gamma di applicazioni, dalla generazione di contenuti creativi all’interpretazione avanzata dei dati. Inoltre, include funzioni di agente AI come Operator di OpenAI, per intenderci. Qwen2.5-VL ad esempio, può analizzare grafici e diagrammi, estrarre dati da fatture e moduli scannerizzati e capire video molto lunghi.

Inoltre, è capace di interagire con il software, sia su PC che su telefoni. In un video di Philipp Schmid di Hugging Face, si vede Qwen2.5-VL che apre Booking.com su Android e prenota un volo da Chongqing a Pechino. Con Linux è andata un po’ meno bene. Alibaba ha anche ottimizzato l’AI per una maggiore efficienza, con tempi di risposta più rapidi e costi computazionali inferiori. Una caratteristica che fa gola sia alle aziende che i singoli utenti.

Come accedere a Qwen 2.5 su Qwen Chat

Chi è interessato a provare Qwen 2.5, ch è completamente gratuito, può accedere tramite Qwen Chat in questo modo:

Aprire il browser web e andare su chat.qwenlm.ai;

Cliccare su “Log in” e accedere usando la propria email o l’account Google;

Una volta dentro, cercare il menu a tendina in alto a sinistra. Questo permette di selezionare tra le diverse versioni di Qwen 2.5;

Scegliere la versione che si desidera utilizzare (Qwen 2.5 Plus, Max o altre varianti);

Iniziare a interagire! Basta inserire il prompt nella casella di chat e Qwen 2.5 genererà una risposta.

L’interfaccia ricorda moltissimo quella di ChatGPT, ma non solo. Da notare la voce “Artifacts“, che permette di costruire web app in JAVA, HTML, CSS, ecc., esattamente come Claude 3.5 Sonnet.

Come utilizzare Qwen 2.5

1. Generare risposte testuali

Utilizzare Qwen 2.5 per attività basate su testo è molto semplice. Basta digitare semplicemente una domanda o richiesta nella casella di chat e l’AI genererà una risposta. Questa funzione è particolarmente utile per la creazione di contenuti, il brainstorming, la ricerca e le conversazioni casuali.

2. Generare immagini AI

Qwen 2.5 ha anche capacità di generazione di immagini. Per utilizzare questa funzione, è sufficiente inserire una descrizione dell’immagine che si desidera e cliccare sull’opzione “Generazione immagine” nella casella di chat. Qwen creerà un’immagine basata sul proprio prompt. Questa funzione è utile per designer, marketer e chiunque desideri creare rapidamente elementi visivi, ad esempio per le piattaforme social o i blog.

3. Generare video AI

Come lo strumento di generazione di immagini AI, Qwen 2.5 può anche generare video basati su prompt testuali. Il processo è simile. Basta digitare un prompt che descriva il video di cui si ha bisogno, selezionare “Generazione video” dalle opzioni e lasciare che Qwen 2.5 generi il video. Questa funzione può essere vantaggiosa per i creatori di contenuti, gli educatori e le aziende che desiderano automatizzare la produzione video.

Qwen 2.5 Max supera DeepSeek?

Reuters ha fatto notare l’insolita tempistica del rilascio di Qwen 2.5-Max, ovvero il primo giorno del Capodanno lunare. Come mai ha attirato tanta attenzione? Perché durante questa festività, la maggior parte dei cinesi è in ferie e trascorre il tempo con la famiglia, non di certo al lavoro. Questo dettaglio sottolinea la pressione che la fulminea ascesa di DeepSeek nelle ultime tre settimane ha esercitato non solo sui rivali d’oltreoceano, ma anche sulla concorrenza nazionale.

Alibaba ha affermato che il suo ultimo modello supera GPT-4o, DeepSeek-V3 e Llama-3.1-405B, almeno stando ai benchmark ufficiali. Se questo corrisponde al vero però, è ancora tutto da verificare. The Register, infatti, ha infatti sollevato dubbi, sottolineando una possibile discrepanza tra il marketing aggressivo di Alibaba e la realtà delle prestazioni effettive.

Detto questo, Qwen 2.5-Max ha un vantaggio concreto rispetto a DeepSeek-V3 (e anche rispetto al più evoluto DeepSeek R1) in un’area specifica: la generazione di immagini e video. A differenza del suo concorrente, Qwen è in grado di creare contenuti visivi, un aspetto che lo rende sicuramente più versatile. Insomma, ancora una volta, nel mondo dell’AI, la battaglia continua e le provocazioni volano più veloci dei benchmark!