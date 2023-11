Stability AI è una startup di intelligenza artificiale generativa che ha fatto parlare di sé con il suo modello di testo-immagine Stable Diffusion, capace di creare opere d’arte realistiche e originali. Ma la generazione di immagini non è l’unico ambito in cui l’azienda vuole innovare. Ora, infatti, si sta cimentando anche nella generazione di codice.

Stability AI ha appena rivelato al pubblico StableCode, il suo nuovo LLM pensato per aiutare gli utenti a generare codice nei vari linguaggi di programmazione. StableCode è disponibile in tre versioni: una versione base per applicazioni generiche, una versione di istruzioni per scrivere codice a partire da una descrizione testuale e una versione di finestre a contesto lungo che può gestire fino a 16.000 token.

StableCode: il nuovo modello di generazione di codice di Stability AI

Il modello StableCode si basa su un insieme di dati iniziale sul linguaggio di programmazione proveniente dal progetto open-source BigCode, che è stato ulteriormente filtrato e ottimizzato da Stability AI. Al momento, StableCode supporta lo sviluppo nei linguaggi di programmazione Python, Go, Java, JavaScript, C, markdown e C++.

“Con questo modello vogliamo fare qualcosa di simile a quello che abbiamo fatto con Stable Diffusion, che ha permesso a chiunque nel mondo di diventare un artista”, ha spiegato a VentureBeat Christian Laforte, responsabile della ricerca di Stability AI, in un’intervista. “Vogliamo fare lo stesso con il modello StableCode: in sostanza, consentire a chiunque abbia delle buone idee [e] magari un problema, di poter scrivere un programma che risolva quel problema”.

Un modello AI basato su BigCode

StableCode è uno strumento di intelligenza artificiale che permette di generare codice a partire da una richiesta in linguaggio naturale. Si tratta di un modello di apprendimento automatico che si basa sui dati provenienti dal progetto BigCode, una grande raccolta di codice sorgente di diversi linguaggi di programmazione. Ma StableCode non si limita a usare i dati di BigCode: li filtra, li pulisce e li arricchisce con tecniche innovative per migliorare la qualità e la diversità del codice generato.

Come StableCode usa i dati di BigCode

BigCode è un progetto che mira a creare un’infrastruttura per l’addestramento e la valutazione di modelli di intelligenza artificiale basati sul codice. Offre una serie di set di dati, di modelli e di servizi per facilitare lo sviluppo di applicazioni di intelligenza artificiale per la codifica. BigCode è stato usato come base per altri strumenti AI per la codifica, come StarCoder, lanciato a maggio da HuggingFace e ServiceNow.

StableCode, tuttavia, non si limita a usare i dati di BigCode così come sono. Nathan Cooper, il capo ricercatore di Stability AI, ha spiegato a VentureBeat in un’intervista esclusiva che StableCode ha applicato dei filtri aggiuntivi ai dati di BigCode per garantire la qualità e la coerenza del codice. Inoltre, ha usato una versione large-context-window del modello, che permette di considerare un contesto più ampio quando si genera il codice.

Cooper ha aggiunto che StableCode ha anche seguito delle fasi di addestramento successive a quelle previste dal modello base di BigCode. Queste fasi comprendono l’addestramento su linguaggi di programmazione specifici, per rendere il modello più specializzato e adatto alle diverse esigenze.

Come StableCode sfrutta la finestra di contesto lunga

Una delle caratteristiche distintive di StableCode è la sua finestra di contesto lunga, che gli permette di generare codice più complesso e personalizzato. La finestra di contesto è la quantità di informazioni che il modello può considerare quando genera il codice. Più la finestra di contesto è lunga, più il modello può tenere conto del codice precedente e successivo, e quindi produrre codice più coerente e appropriato.

La finestra di contesto di StableCode è di 16.000 token, che secondo Stability AI è più grande di qualsiasi altro modello.