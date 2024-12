I generatori di immagini AI sono sempre più precisi e performanti. Per seguire gli sviluppi e individuare i modelli più efficienti, da diversi mesi Artificial Analysis offre una classifica aggiornata in tempo reale: la Text to Image Arena.

Ispirata al principio di Chatbot Arena, questa classifica vuole essere obiettiva: si basa su duelli tra modelli anonimizzati, arbitrati da esseri umani. Nella scheda Image Arena gli utenti confrontano i risultati generati dallo stesso prompt e scelgono quello che risponde con maggiore precisione alla query iniziale.

I 10 migliori generatori di immagini AI a dicembre 2024

A differenza di Chatbot Arena, che ora è dominata principalmente da OpenAI e Google, la classifica proposta da Artificial Analysis ha visto pochi cambiamenti a dicembre.

Come a novembre, è Recraft, sviluppato da un ingegnere collaboratore di Microsoft, Google e Yandex – e a lungo nascosta sotto il nome Red_Panda – che mantiene la leadership con un punteggio di 1164 Elo. La terza versione del modello, che alimenta lo strumento offerto sulla piattaforma omonima, è superiore ai modelli FLUX1.1 Pro e FLUX.1 Pro di Black Forest Labs e alla versione 6.1 di Midjourney, che sembra piuttosto concentrarsi, nelle ultime settimane, sull’aggiunta di funzionalità piuttosto che sull’ottimizzazione del proprio modello.

Il modello v2 di Ideogram scende in sesta posizione, mentre Stable Diffusion 3.5 Large Turbo e Stable Diffusion 3.5 Large di Stability.ai sono in nona e decima posizione nella classifica. E come nei mesi precedenti, DALL-E di OpenAI e Firefly di Adobe non compaiono nella prima parte della tabella.

Ecco i 10 generatori di immagini più performanti:

Recraft V3: 1.161 (punteggio Elo)

FLUX 1.1 [pro]: 1.128

FLUX.1 [pro]: 1.110

Midjourneyy v6.1: 1.092

FLUX.1 [dev]: 1.088

Ideogramma v2: 1.088

Midjourney v6: 1.084

Ideogramma v2 Turbo: 1.081

Stable Diffusion 3.5 Large Turbo: 1.080

Stable Diffusion 3,5 ampia: 1.076

I criteri di classificazione di Arena Text to Image

L’analisi si basa sul sistema Elo, utilizzato anche da LMSYS per il suo Chatbot Arena, per classificare i modelli. A ogni modello viene assegnato un punteggio Elo, che può essere paragonato ad un punteggio in evoluzione, basato sulle sue prestazioni durante i confronti. Una sconfitta contro un modello apparentemente più debole comporta una diminuzione del suo punteggio, mentre una vittoria contro un avversario più forte gli fa guadagnare punti. Secondo Artificial Analysis, la classifica viene rivista ogni ora.