DeepSeek, l’azienda cinese di AI diventata virale, ha appena rilasciato Janus-Pro, una serie di modelli di AI multimodali che promettono di superare DALL-E 3 di OpenAI.
DeepSeek lancia Janus-Pro, la nuova famiglia di modelli AI per la generazione di immagini
I modelli Janus-Pro sono disponibili per il download sulla piattaforma di sviluppo AI Hugging Face. La loro dimensione varia da 1 a 7 miliardi di parametri, che corrispondono alle capacità di risoluzione dei problemi di un modello. Più parametri significa generalmente prestazioni migliori. La licenza MIT che copre Janus-Pro permette l’utilizzo commerciale senza restrizioni.
Janus-Pro non solo analizza le immagini, ma ne crea anche di nuove. Secondo DeepSeek, il modello più grande, Janus-Pro-7B, ha superato DALL-E 3 e altri modelli come PixArt-alpha, Emu3-Gen e Stable Diffusion XL di Stability AI su due benchmark di valutazione dell’intelligenza artificiale: GenEval e DPG-Bench.
Nonostante alcuni di questi modelli siano datati, le prestazioni di Janus-Pro restano impressionanti, considerando le loro dimensioni compatte.
DeepSeek: un laboratorio cinese che sfida il primato USA nell’AI
DeepSeek, finanziato principalmente dalla società di trading quantitativo High-Flyer Capital Management, sta facendo impazzire la Silicon Valley. Il suo modello R1 supera OpenAI o1. Inoltre, è attualmente l’app gratuita più scaricata su Apple Store, davanti a ChatGPT.
I modelli linguistici di DeepSeek, addestrati con tecniche efficienti dal punto di vista del calcolo, hanno spinto molti analisti di Wall Street ed esperti tech a interrogarsi sulla capacità degli Stati Uniti di mantenere il primato nella corsa all’intelligenza artificiale e sulla sostenibilità della domanda di chip per l’AI.