Quasi 700 milioni di utenti attivi su base settimanale e un rollout problematico per GPT-5 stanno mettendo a dura prova l’infrastruttura di OpenAI su cui poggia ChatGPT. Il numero uno Sam Altman ha anticipato nei giorni scorsi l’esigenza di ottimizzare i sistemi in uso per far fronte a una domanda di elaborazione sempre più elevata e ora è tornato sull’argomento per fornire nuovi dettagli.
ChatGPT più lento per gli utenti Free?
In un post su X pubblicato oggi, il CEO rende nota quella che potremmo definire una scala di priorità. Le risorse a disposizione non sono infinite ed è necessario ripartirle in modo da non compromettere la qualità del servizio erogato, per quanto possibile. Ecco gli step di un processo che dovrebbe durare un paio di mesi.
- Per prima cosa, ci assicureremo che gli attuali utenti paganti di ChatGPT ottengano un accesso a GPT-5 complessivamente maggiore rispetto a prima.
- Daremo quindi priorità alla domanda di API, in base alla capacità attualmente assegnata e agli impegni presi con i clienti. Per dare un’idea approssimativa, con questa capacità possiamo supportare un ulteriore aumento di circa il 30% delle nuove API rispetto alla nostra attuale situazione.
- Aumenteremo quindi la qualità del livello gratuito di ChatGPT.
- Infine, daremo priorità alle nuove richieste di API.
Insomma, un occhio di riguardo per gli abbonati e per i clienti che già mettono mano al portafoglio per accedere alle API. Poi l’esperienza migliorerà anche per gli utenti Free, che nelle prossime settimane potrebbero dunque trovare l’interazione con ChatGPT più lenta del solito.
La crescente domanda è attribuita proprio all’introduzione di GPT-5, il modello più esigente tra quelli fin qui addestrati.
Più potenza di calcolo per il futuro
All’orizzonte c’è comunque un ampliamento dell’infrastruttura a disposizione di OpenAI. La capacità sarà raddoppiata, entro l’inizio del 2026.
Nei prossimi cinque mesi raddoppieremo la nostra flotta di elaborazione dati, quindi la situazione dovrebbe migliorare.
Anche a questo serviranno i nuovi accordi siglati di recente con Google e Oracle. L’obiettivo più di lungo termine è quello di creare data center dedicati come parte dell’iniziativa Stargate che prevede investimenti per 500 miliardi di dollari entro i prossimi quattro anni.