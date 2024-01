La generazione di codice con l’intelligenza artificiale generativa sta diventando sempre più potente e compatta. Stability AI, una delle aziende leader nel settore, ha appena annunciato il suo primo nuovo modello AI del 2024: Stable Code 3B. Si tratta di un modello con licenza commerciale, disponibile tramite iscrizione, che offre capacità avanzate di completamento del codice per lo sviluppo di software.

Un modello compatto da 3 miliardi di parametri

Stable Code 3B è un modello a 3 miliardi di parametri, una dimensione relativamente piccola rispetto ad altri modelli di generazione di codice, come CodeLLaMA di Meta, che ne ha 7 miliardi. Tuttavia, nonostante la sua dimensione ridotta, Stable Code 3B offre prestazioni e capacità competitive, se non superiori, rispetto ai modelli più grandi.

Uno dei vantaggi di Stable Code 3B è che può essere eseguito localmente su computer portatili senza GPU dedicate, il che lo rende più accessibile e conveniente per gli sviluppatori. Inoltre, fa parte della famiglia di modelli compatti di Stability AI, che include anche StableLM Zephyr 3B per la generazione di testi, lanciato alla fine del 2023.

Stability AI ha introdotto per la prima volta Stable Code nell’agosto 2023 con il rilascio iniziale di LLM per la generazione di codice e da allora ha lavorato costantemente per migliorare la tecnologia.

Funzionalità avanzate di completamento del codice

Stable Code 3B presenta diverse novità rispetto al rilascio iniziale. Una delle più importanti è la capacità di riempire sezioni mancanti più grandi nel codice esistente, oltre a suggerire nuove linee di codice. Questa funzionalità avanzata di completamento del codice è nota come Fill in the Middle (FIM) ed è molto utile per risparmiare tempo e ridurre gli errori.

Un altro miglioramento riguarda l’addestramento del modello, che è stato ottimizzato con un contesto di dimensioni più ampie, grazie a una tecnica nota come RoPE (Rotary Position Embeddings). Questa tecnica consente una lunghezza del contesto fino a 100k token, il che significa che il modello può tenere conto di più informazioni rilevanti per generare il codice. La tecnica RoPE è utilizzata anche da altri LLM, tra cui Llama 2 Long di Meta.

Stable Code 3B si basa sul modello di linguaggio naturale Stable LM 3B di Stability AI, che è stato addestrato su una vasta gamma di dati linguistici generali. Con un ulteriore addestramento incentrato sui dati dell’ingegneria del software, il modello ha acquisito capacità di completamento del codice, pur mantenendo i punti di forza nei compiti linguistici generali. I dati di addestramento comprendono archivi di codice, forum di programmatori e altre fonti tecniche.

Prestazioni competitive con modelli più grandi

Stable Code 3B è in grado di generare codice in diversi linguaggi di programmazione popolari, tra cui Python, Java, JavaScript, Go, Ruby e C++. Stability AI sostiene che il modello ha dimostrato di essere leader nei test di benchmark su questi linguaggi, mostrando una qualità di completamento pari o superiore a quella di modelli di dimensioni più che doppie.

Il mercato degli strumenti di generazione di codice per l’intelligenza artificiale è piuttosto “affollato, con diversi strumenti disponibili, come CodeLLaMA 7B di Meta; StarCoder LLM, sviluppato come open source con la partecipazione di IBM; HuggingFace e ServiceNow. Stability AI sostiene che Stable Code 3B supera StarCoder nei linguaggi di programmazione Python, C++, JavaScript, Java, PHP e Rust.

Un modello disponibile tramite abbonamento

Stability AI rende disponibile Stable Code 3B per uso commerciale come parte del suo nuovo servizio di abbonamento, annunciato per la prima volta a dicembre. I membri ottengono l’accesso a Stable Code 3B insieme ad altri strumenti AI del portafoglio di Stability AI, tra cui gli strumenti di generazione di immagini a diffusione stabile SDXL, StableLM Zephyr 3B per la generazione di contenuti testuali, Stable Audio per la generazione di audio e Stable Video per la generazione di video.