VB, M.Nzuñez
Lunedì OpenAI ha rilasciato una nuova applicazione desktop per il suo sistema di codifica di intelligenza artificiale Codex , uno strumento che, secondo l’azienda, trasforma lo sviluppo software da un esercizio collaborativo con un singolo assistente AI in qualcosa di più simile alla gestione di un team di lavoratori autonomi.
L’ app Codex per macOS funziona come quello che i dirigenti di OpenAI descrivono come un “centro di comando per agenti”, consentendo agli sviluppatori di delegare più attività di codifica contemporaneamente, automatizzare il lavoro ripetitivo e supervisionare i sistemi di intelligenza artificiale che possono funzionare fino a 30 minuti in modo indipendente prima di restituire il codice completato.
“Questo è il prodotto interno più apprezzato che abbiamo mai avuto”, ha dichiarato Sam Altman, amministratore delegato di OpenAI, a VentureBeat in una conferenza stampa prima del lancio di lunedì. “È stato davvero fantastico per noi utilizzarlo di recente in OpenAI.”
Il lancio arriva in un momento cruciale per il mercato dell’intelligenza artificiale aziendale. Secondo un sondaggio condotto su 100 aziende Global 2000, pubblicato la scorsa settimana dalla società di venture capital Andreessen Horowitz, il 78% dei CIO aziendali utilizza ora modelli OpenAI in produzione , sebbene i concorrenti Anthropic e Google stiano guadagnando rapidamente terreno. Anthropic ha registrato il maggiore incremento di quota di mercato tra tutti i laboratori di frontiera da maggio 2025, con un incremento del 25% nella penetrazione aziendale, con il 44% delle aziende che ora utilizza Anthropic in produzione.
La tempistica del lancio dell’app Codex di OpenAI , focalizzata sui flussi di lavoro di ingegneria del software professionale, sembra studiata per difendere la posizione dell’azienda in quello che è diventato il segmento più conteso del mercato dell’intelligenza artificiale: gli strumenti di codifica.https://www.youtube.com/embed/HFM3se4lNiw
Perché gli sviluppatori stanno abbandonando i loro IDE per la gestione degli agenti AI
L’ app Codex introduce un approccio radicalmente diverso alla codifica assistita dall’intelligenza artificiale. Mentre strumenti precedenti come GitHub Copilot si concentravano sul completamento automatico di righe di codice in tempo reale, la nuova applicazione consente agli sviluppatori di “gestire senza sforzo più agenti contemporaneamente, eseguire lavori in parallelo e collaborare con gli agenti su attività di lunga durata”.
Alexander Embiricos , responsabile del prodotto Codex, ha spiegato l’evoluzione durante la conferenza stampa ripercorrendo le origini del prodotto fino al 2021, quando OpenAI ha introdotto per la prima volta un modello chiamato Codex che alimentava GitHub Copilot.
“A quei tempi, le persone usavano l’intelligenza artificiale per scrivere piccole porzioni di codice nei loro IDE”, ha detto Embiricos. “GPT-5, nell’agosto dello scorso anno, ha segnato un grande balzo in avanti, e poi 5.2, a dicembre, ha segnato un altro balzo in avanti, con cui le persone hanno iniziato a svolgere attività sempre più lunghe, chiedendo ai modelli di lavorare in modo completo. Quindi, quello che abbiamo visto è che gli sviluppatori, invece di lavorare a stretto contatto con il modello, con il pair coding, hanno iniziato a delegare intere funzionalità.”
Il cambiamento è stato così profondo che Altman ha affermato di aver recentemente completato un importante progetto di codifica senza mai aprire un ambiente di sviluppo integrato tradizionale.
“Sono rimasto sbalordito da questo… Ho portato a termine questo progetto piuttosto grande in pochi giorni all’inizio di questa settimana e durante il fine settimana. Non ho aperto un IDE durante il processo. Nemmeno una volta”, ha detto Altman. “Ho dato un’occhiata al codice, ma non lo stavo facendo alla vecchia maniera, e non pensavo che sarebbe successo a questo punto.”
Come le competenze e le automazioni estendono la codifica dell’intelligenza artificiale oltre la semplice generazione di codice
L’ app Codex introduce diverse nuove funzionalità progettate per estendere la programmazione basata sull’intelligenza artificiale oltre la semplice scrittura di righe di codice. Tra queste, le principali sono le “Competenze”, che raggruppano istruzioni, risorse e script in modo che Codex possa “connettersi in modo affidabile agli strumenti, eseguire flussi di lavoro e completare le attività in base alle preferenze del team”.
L’app include un’interfaccia dedicata per la creazione e la gestione delle competenze, e gli utenti possono richiamare esplicitamente competenze specifiche o consentire al sistema di selezionarle automaticamente in base all’attività da svolgere. OpenAI ha pubblicato una libreria di competenze per flussi di lavoro comuni, inclusi strumenti per recuperare il contesto di progettazione da Figma, gestire progetti in Linear, distribuire applicazioni web su host cloud come Cloudflare e Vercel, generare immagini utilizzando GPT Image e creare documenti professionali in formato PDF, foglio di calcolo e Word.
Per dimostrare le capacità del sistema, OpenAI ha chiesto a Codex di creare un gioco di corse a partire da un singolo prompt. Utilizzando una competenza di generazione di immagini e una di sviluppo di giochi web, Codex ha creato il gioco lavorando in modo indipendente utilizzando oltre 7 milioni di token con un solo prompt utente iniziale, assumendo “i ruoli di designer, sviluppatore di giochi e tester del controllo qualità per convalidare il proprio lavoro giocandoci”.
L’azienda ha anche introdotto le “Automazioni”, che consentono agli sviluppatori di programmare Codex affinché funzioni in background secondo una pianificazione automatica. “Al termine di un’Automazione, i risultati vengono inseriti in una coda di revisione, così è possibile riprendere a lavorare se necessario.”
Thibault Sottiaux , a capo del team Codex di OpenAI, ha descritto come l’azienda utilizza queste automazioni internamente: “Abbiamo utilizzato le automazioni per gestire le attività ripetitive ma importanti, come la selezione quotidiana dei problemi, l’individuazione e il riepilogo degli errori di CI, la generazione di brief di rilascio giornalieri, la verifica dei bug e altro ancora.”
L’app include anche il supporto integrato per gli “alberi di lavoro”, consentendo a più agenti di lavorare sullo stesso repository senza conflitti. “Ogni agente lavora su una copia isolata del codice, consentendo di esplorare percorsi diversi senza dover monitorare il loro impatto sulla base di codice.”
OpenAI combatte Anthropic e Google per il controllo della spesa aziendale per l’intelligenza artificiale
Il lancio avviene in un momento in cui la spesa aziendale per strumenti di programmazione basati sull’intelligenza artificiale sta registrando una forte accelerazione. Secondo l’indagine di Andreessen Horowitz , la spesa media aziendale per l’intelligenza artificiale su modelli linguistici di grandi dimensioni è aumentata da circa 4,5 milioni di dollari a 7 milioni di dollari negli ultimi due anni, con le aziende che prevedono una crescita di un ulteriore 65% quest’anno, raggiungendo circa 11,6 milioni di dollari.
La leadership nel mercato dell’intelligenza artificiale aziendale varia significativamente a seconda dei casi d’uso. OpenAI domina “i primi casi d’uso orizzontali come chatbot generici, gestione della conoscenza aziendale e assistenza clienti”, mentre Anthropic è leader nello “sviluppo software e nell’analisi dei dati, dove i CIO citano costantemente rapidi miglioramenti delle capacità a partire dalla seconda metà del 2024”.
Quando, durante la conferenza stampa, gli è stato chiesto in che modo Codex si differenzia da Claude Code di Anthropic , che è stato descritto come il suo “momento ChatGPT”, Sottiaux ha sottolineato l’attenzione di OpenAI sulla capacità di modellare attività di lunga durata.
“Una delle cose in cui i nostri modelli sono estremamente efficaci è che si collocano davvero al limite dell’intelligenza e svolgono un lavoro affidabile per lunghi periodi di tempo”, ha affermato Sottiaux. “È anche per questo che stiamo ottimizzando questa nuova superficie, in modo da poter avviare molti agenti paralleli e coordinarli per lunghi periodi di tempo senza perdersi.”
Altman ha aggiunto che, sebbene molti strumenti siano in grado di gestire “front-end di codifica delle vibrazioni”, il modello 5.2 di OpenAI rimane “di gran lunga il modello più forte” per lavori sofisticati su sistemi complessi.
“Prendere quel livello di capacità del modello e inserirlo in un’interfaccia in cui si possa fare ciò che Thibault diceva, crediamo che sarà molto importante”, ha detto Altman. “Probabilmente, almeno ascoltare gli utenti e analizzare le conversazioni sui social media è il singolo fattore di differenziazione più importante.”
La sorprendente soddisfazione sui progressi dell’intelligenza artificiale: quanto velocemente gli esseri umani possono digitare
Il fondamento filosofico dell’app Codex riflette un punto di vista che i dirigenti di OpenAI stanno articolando da mesi: sono i limiti umani, non le capacità dell’intelligenza artificiale, a costituire ora il principale vincolo alla produttività.
In un’apparizione di dicembre al Lenny’s Podcast , Embiricos ha descritto la velocità di digitazione umana come “l’attuale fattore limitante sottovalutato” per il raggiungimento dell’intelligenza artificiale generale. La logica: se l’IA può eseguire compiti di codifica complessi ma gli esseri umani non riescono a scrivere prompt o a rivedere i risultati abbastanza velocemente, il progresso si blocca.
L’ app Codex cerca di risolvere questo problema abilitando quella che il team chiama una “mentalità dell’abbondanza”, ovvero l’esecuzione di più attività in parallelo anziché perfezionare singole richieste. Durante il briefing, Embiricos ha descritto come gli utenti esperti di OpenAI utilizzano lo strumento.
“Ieri sera stavo lavorando all’app e stavo apportando alcune modifiche, e tutte queste modifiche possono essere eseguite in parallelo. E io le gestivo e le gestivo”, ha detto Embiricos. “Dietro le quinte, tutte queste attività vengono eseguite su qualcosa chiamato gate work tree, il che significa che gli agenti funzionano in modo indipendente e non è necessario gestirli.”
Nel podcast di Sequoia Capital ” Training Data “, Embiricos ha spiegato questo cambiamento di mentalità: “La mentalità che funziona davvero bene per Codex è, tipo, questa mentalità dell’abbondanza e, tipo, ehi, proviamo qualsiasi cosa. Proviamo qualsiasi cosa anche più volte e vediamo cosa funziona”. Ha osservato che quando gli utenti eseguono 20 o più attività in un giorno o in un’ora, “probabilmente hanno capito fondamentalmente come usare lo strumento”.
Creare fiducia attraverso sandbox: come OpenAI protegge gli agenti di codifica autonomi
OpenAI ha integrato misure di sicurezza nell’architettura del Codex fin dalle fondamenta. L’app utilizza “sandbox a livello di sistema nativo, open source e configurabile” e, per impostazione predefinita, “gli agenti del Codex si limitano a modificare i file nella cartella o nel ramo in cui stanno lavorando e a utilizzare la ricerca web memorizzata nella cache, chiedendo poi l’autorizzazione per eseguire comandi che richiedono autorizzazioni elevate come l’accesso alla rete”.Durante il briefing, Embiricos ha illustrato nel dettaglio l’approccio alla sicurezza, sottolineando che OpenAI ha reso open source la sua tecnologia sandbox.”Codex ha questa sandbox di cui siamo davvero molto orgogliosi, ed è open source, quindi potete provarla”, ha detto Embiricos. La sandbox “in pratica garantisce che quando l’agente lavora sul vostro computer, possa scrivere solo in una cartella specifica su cui si desidera che acquisisca i diritti, e non acceda alla rete senza informazioni”.Il sistema include anche un modello di autorizzazione granulare che consente agli utenti di configurare approvazioni persistenti per azioni specifiche, evitando la necessità di autorizzare ripetutamente operazioni di routine. “Se l’agente vuole fare qualcosa e ti senti infastidito dal dover approvare costantemente, invece di dire semplicemente ‘Va bene, puoi fare tutto’, puoi semplicemente dire ‘Ehi, ricorda una cosa: in realtà sono d’accordo che tu faccia questo in futuro'”, ha spiegato Embiricos.Altman ha sottolineato che l’architettura dei permessi segnala una filosofia più ampia sulla sicurezza dell’IA nei sistemi agenti.”Penso che questo sarà davvero importante. Voglio dire, ci è stato chiarissimo usandolo, quanto si desidera che abbia il controllo del computer e quanto ne sia necessario”, ha detto Altman. “E il modo in cui il team ha progettato Codex, in modo che si possa limitare in modo sensato ciò che accade e scegliere il livello di controllo con cui ci si sente a proprio agio, è importante.”Ha anche riconosciuto la natura a duplice uso della tecnologia. “Prevediamo di raggiungere molto presto il massimo livello di sicurezza informatica interna dei nostri modelli. Ci stiamo preparando per questo. Abbiamo discusso del nostro piano di mitigazione”, ha affermato Altman. “Una vera sfida per il mondo sarà difendersi da numerose minacce informatiche di grande portata utilizzando questi modelli in tempi rapidi”.Le stesse capacità che rendono Codex prezioso per la correzione di bug e il refactoring del codice potrebbero, nelle mani sbagliate, essere utilizzate per scoprire vulnerabilità o scrivere software dannoso: una tensione che non farà che intensificarsi man mano che gli agenti di codifica AI diventeranno più capaci.
AI IMPACT: Supply, Demand, and System Design: Navigating AI Infrastructure Trade-offsIl lancio arriva in un momento cruciale per il mercato dell’intelligenza artificiale aziendale. Secondo un sondaggio condotto su 100 aziende Global 2000, pubblicato la scorsa settimana dalla società di venture capital Andreessen Horowitz, il 78% dei CIO aziendali utilizza ora modelli OpenAI in produzione , sebbene i concorrenti Anthropic e Google stiano guadagnando rapidamente terreno. Anthropic ha registrato il maggiore incremento di quota di mercato tra tutti i laboratori di frontiera da maggio 2025, con un incremento del 25% nella penetrazione aziendale, con il 44% delle aziende che ora utilizza Anthropic in produzione.La tempistica del lancio dell’app Codex di OpenAI , focalizzata sui flussi di lavoro di ingegneria del software professionale, sembra studiata per difendere la posizione dell’azienda in quello che è diventato il segmento più conteso del mercato dell’intelligenza artificiale: gli strumenti di codifica.Perché gli sviluppatori stanno abbandonando i loro IDE per la gestione degli agenti AIL’ app Codex introduce un approccio radicalmente diverso alla codifica assistita dall’intelligenza artificiale. Mentre strumenti precedenti come GitHub Copilot si concentravano sul completamento automatico di righe di codice in tempo reale, la nuova applicazione consente agli sviluppatori di “gestire senza sforzo più agenti contemporaneamente, eseguire lavori in parallelo e collaborare con gli agenti su attività di lunga durata”.Alexander Embiricos , responsabile del prodotto Codex, ha spiegato l’evoluzione durante la conferenza stampa ripercorrendo le origini del prodotto fino al 2021, quando OpenAI ha introdotto per la prima volta un modello chiamato Codex che alimentava GitHub Copilot.”A quei tempi, le persone usavano l’intelligenza artificiale per scrivere piccole porzioni di codice nei loro IDE”, ha detto Embiricos. “GPT-5, nell’agosto dello scorso anno, ha segnato un grande balzo in avanti, e poi 5.2, a dicembre, ha segnato un altro balzo in avanti, con cui le persone hanno iniziato a svolgere attività sempre più lunghe, chiedendo ai modelli di lavorare in modo completo. Quindi, quello che abbiamo visto è che gli sviluppatori, invece di lavorare a stretto contatto con il modello, con il pair coding, hanno iniziato a delegare intere funzionalità.”Il cambiamento è stato così profondo che Altman ha affermato di aver recentemente completato un importante progetto di codifica senza mai aprire un ambiente di sviluppo integrato tradizionale.”Sono rimasto sbalordito da questo… Ho portato a termine questo progetto piuttosto grande in pochi giorni all’inizio di questa settimana e durante il fine settimana. Non ho aperto un IDE durante il processo. Nemmeno una volta”, ha detto Altman. “Ho dato un’occhiata al codice, ma non lo stavo facendo alla vecchia maniera, e non pensavo che sarebbe successo a questo punto.”Come le competenze e le automazioni estendono la codifica dell’intelligenza artificiale oltre la semplice generazione di codiceL’ app Codex introduce diverse nuove funzionalità progettate per estendere la programmazione basata sull’intelligenza artificiale oltre la semplice scrittura di righe di codice. Tra queste, le principali sono le “Competenze”, che raggruppano istruzioni, risorse e script in modo che Codex possa “connettersi in modo affidabile agli strumenti, eseguire flussi di lavoro e completare le attività in base alle preferenze del team”.L’app include un’interfaccia dedicata per la creazione e la gestione delle competenze, e gli utenti possono richiamare esplicitamente competenze specifiche o consentire al sistema di selezionarle automaticamente in base all’attività da svolgere. OpenAI ha pubblicato una libreria di competenze per flussi di lavoro comuni, inclusi strumenti per recuperare il contesto di progettazione da Figma, gestire progetti in Linear, distribuire applicazioni web su host cloud come Cloudflare e Vercel, generare immagini utilizzando GPT Image e creare documenti professionali in formato PDF, foglio di calcolo e Word.Per dimostrare le capacità del sistema, OpenAI ha chiesto a Codex di creare un gioco di corse a partire da un singolo prompt. Utilizzando una competenza di generazione di immagini e una di sviluppo di giochi web, Codex ha creato il gioco lavorando in modo indipendente utilizzando oltre 7 milioni di token con un solo prompt utente iniziale, assumendo “i ruoli di designer, sviluppatore di giochi e tester del controllo qualità per convalidare il proprio lavoro giocandoci”.L’azienda ha anche introdotto le “Automazioni”, che consentono agli sviluppatori di programmare Codex affinché funzioni in background secondo una pianificazione automatica. “Al termine di un’Automazione, i risultati vengono inseriti in una coda di revisione, così è possibile riprendere a lavorare se necessario.”Thibault Sottiaux , a capo del team Codex di OpenAI, ha descritto come l’azienda utilizza queste automazioni internamente: “Abbiamo utilizzato le automazioni per gestire le attività ripetitive ma importanti, come la selezione quotidiana dei problemi, l’individuazione e il riepilogo degli errori di CI, la generazione di brief di rilascio giornalieri, la verifica dei bug e altro ancora.”L’app include anche il supporto integrato per gli “alberi di lavoro”, consentendo a più agenti di lavorare sullo stesso repository senza conflitti. “Ogni agente lavora su una copia isolata del codice, consentendo di esplorare percorsi diversi senza dover monitorare il loro impatto sulla base di codice.”OpenAI combatte Anthropic e Google per il controllo della spesa aziendale per l’intelligenza artificialeIl lancio avviene in un momento in cui la spesa aziendale per strumenti di programmazione basati sull’intelligenza artificiale sta registrando una forte accelerazione. Secondo l’indagine di Andreessen Horowitz , la spesa media aziendale per l’intelligenza artificiale su modelli linguistici di grandi dimensioni è aumentata da circa 4,5 milioni di dollari a 7 milioni di dollari negli ultimi due anni, con le aziende che prevedono una crescita di un ulteriore 65% quest’anno, raggiungendo circa 11,6 milioni di dollari.La leadership nel mercato dell’intelligenza artificiale aziendale varia significativamente a seconda dei casi d’uso. OpenAI domina “i primi casi d’uso orizzontali come chatbot generici, gestione della conoscenza aziendale e assistenza clienti”, mentre Anthropic è leader nello “sviluppo software e nell’analisi dei dati, dove i CIO citano costantemente rapidi miglioramenti delle capacità a partire dalla seconda metà del 2024”.Quando, durante la conferenza stampa, gli è stato chiesto in che modo Codex si differenzia da Claude Code di Anthropic , che è stato descritto come il suo “momento ChatGPT”, Sottiaux ha sottolineato l’attenzione di OpenAI sulla capacità di modellare attività di lunga durata.”Una delle cose in cui i nostri modelli sono estremamente efficaci è che si collocano davvero al limite dell’intelligenza e svolgono un lavoro affidabile per lunghi periodi di tempo”, ha affermato Sottiaux. “È anche per questo che stiamo ottimizzando questa nuova superficie, in modo da poter avviare molti agenti paralleli e coordinarli per lunghi periodi di tempo senza perdersi.”Altman ha aggiunto che, sebbene molti strumenti siano in grado di gestire “front-end di codifica delle vibrazioni”, il modello 5.2 di OpenAI rimane “di gran lunga il modello più forte” per lavori sofisticati su sistemi complessi.”Prendere quel livello di capacità del modello e inserirlo in un’interfaccia in cui si possa fare ciò che Thibault diceva, crediamo che sarà molto importante”, ha detto Altman. “Probabilmente, almeno ascoltare gli utenti e analizzare le conversazioni sui social media è il singolo fattore di differenziazione più importante.”La sorprendente soddisfazione sui progressi dell’intelligenza artificiale: quanto velocemente gli esseri umani possono digitareIl fondamento filosofico dell’app Codex riflette un punto di vista che i dirigenti di OpenAI stanno articolando da mesi: sono i limiti umani, non le capacità dell’intelligenza artificiale, a costituire ora il principale vincolo alla produttività.In un’apparizione di dicembre al Lenny’s Podcast , Embiricos ha descritto la velocità di digitazione umana come “l’attuale fattore limitante sottovalutato” per il raggiungimento dell’intelligenza artificiale generale. La logica: se l’IA può eseguire compiti di codifica complessi ma gli esseri umani non riescono a scrivere prompt o a rivedere i risultati abbastanza velocemente, il progresso si blocca.L’ app Codex cerca di risolvere questo problema abilitando quella che il team chiama una “mentalità dell’abbondanza”, ovvero l’esecuzione di più attività in parallelo anziché perfezionare singole richieste. Durante il briefing, Embiricos ha descritto come gli utenti esperti di OpenAI utilizzano lo strumento.”Ieri sera stavo lavorando all’app e stavo apportando alcune modifiche, e tutte queste modifiche possono essere eseguite in parallelo. E io le gestivo e le gestivo”, ha detto Embiricos. “Dietro le quinte, tutte queste attività vengono eseguite su qualcosa chiamato gate work tree, il che significa che gli agenti funzionano in modo indipendente e non è necessario gestirli.”Nel podcast di Sequoia Capital ” Training Data “, Embiricos ha spiegato questo cambiamento di mentalità: “La mentalità che funziona davvero bene per Codex è, tipo, questa mentalità dell’abbondanza e, tipo, ehi, proviamo qualsiasi cosa. Proviamo qualsiasi cosa anche più volte e vediamo cosa funziona”. Ha osservato che quando gli utenti eseguono 20 o più attività in un giorno o in un’ora, “probabilmente hanno capito fondamentalmente come usare lo strumento”.Creare fiducia attraverso sandbox: come OpenAI protegge gli agenti di codifica autonomiOpenAI ha integrato misure di sicurezza nell’architettura del Codex fin dalle fondamenta. L’app utilizza “sandbox a livello di sistema nativo, open source e configurabile” e, per impostazione predefinita, “gli agenti del Codex si limitano a modificare i file nella cartella o nel ramo in cui stanno lavorando e a utilizzare la ricerca web memorizzata nella cache, chiedendo poi l’autorizzazione per eseguire comandi che richiedono autorizzazioni elevate come l’accesso alla rete”.Durante il briefing, Embiricos ha illustrato nel dettaglio l’approccio alla sicurezza, sottolineando che OpenAI ha reso open source la sua tecnologia sandbox.”Codex ha questa sandbox di cui siamo davvero molto orgogliosi, ed è open source, quindi potete provarla”, ha detto Embiricos. La sandbox “in pratica garantisce che quando l’agente lavora sul vostro computer, possa scrivere solo in una cartella specifica su cui si desidera che acquisisca i diritti, e non acceda alla rete senza informazioni”.Il sistema include anche un modello di autorizzazione granulare che consente agli utenti di configurare approvazioni persistenti per azioni specifiche, evitando la necessità di autorizzare ripetutamente operazioni di routine. “Se l’agente vuole fare qualcosa e ti senti infastidito dal dover approvare costantemente, invece di dire semplicemente ‘Va bene, puoi fare tutto’, puoi semplicemente dire ‘Ehi, ricorda una cosa: in realtà sono d’accordo che tu faccia questo in futuro'”, ha spiegato Embiricos.Altman ha sottolineato che l’architettura dei permessi segnala una filosofia più ampia sulla sicurezza dell’IA nei sistemi agenti.”Penso che questo sarà davvero importante. Voglio dire, ci è stato chiarissimo usandolo, quanto si desidera che abbia il controllo del computer e quanto ne sia necessario”, ha detto Altman. “E il modo in cui il team ha progettato Codex, in modo che si possa limitare in modo sensato ciò che accade e scegliere il livello di controllo con cui ci si sente a proprio agio, è importante.”Ha anche riconosciuto la natura a duplice uso della tecnologia. “Prevediamo di raggiungere molto presto il massimo livello di sicurezza informatica interna dei nostri modelli. Ci stiamo preparando per questo. Abbiamo discusso del nostro piano di mitigazione”, ha affermato Altman. “Una vera sfida per il mondo sarà difendersi da numerose minacce informatiche di grande portata utilizzando questi modelli in tempi rapidi”.Le stesse capacità che rendono Codex prezioso per la correzione di bug e il refactoring del codice potrebbero, nelle mani sbagliate, essere utilizzate per scoprire vulnerabilità o scrivere software dannoso: una tensione che non farà che intensificarsi man mano che gli agenti di codifica AI diventeranno più capaci.Dalle app Android alle scoperte della ricerca: come Codex ha trasformato le operazioni di OpenAIForse la prova più convincente delle capacità di Codex proviene dall’uso dello strumento da parte di OpenAI. Sottiaux ha descritto come il sistema abbia accelerato lo sviluppo interno.”Un esempio di ciò è l’ app Sora per Android: quattro ingegneri hanno completato internamente la spedizione in soli 18 giorni e poi, nel giro di un mese, abbiamo dato accesso al mondo”, ha affermato Sottiaux. “Non avevo mai notato una tale velocità su questa scala prima d’ora.”Oltre allo sviluppo del prodotto, Sottiaux ha descritto come Codex sia diventato parte integrante delle attività di ricerca di OpenAI.”Il Codex è davvero coinvolto in tutte le fasi della ricerca: dalla creazione di nuovi set di dati alle analisi dei propri screening”, ha affermato. “Quando partecipo a riunioni con i ricercatori, tutti inviano il Codex a svolgere un’indagine mentre ne parliamo, e poi torna con informazioni utili, e siamo in grado di risolvere i problemi molto più velocemente”.Lo strumento ha anche iniziato a contribuire al proprio sviluppo. “Anche Codex sta iniziando a svilupparsi autonomamente”, ha osservato Sottiaux. “Non c’è schermata all’interno del team di progettazione di Codex che non lo veda impegnato in più attività, sei, otto, dieci, contemporaneamente.”Alla domanda se ciò costituisca una prova di “auto-miglioramento ricorsivo” (un concetto che da tempo preoccupa i ricercatori sulla sicurezza dell’intelligenza artificiale), Sottiaux ha risposto in modo misurato.”C’è sempre un essere umano coinvolto”, ha detto. “Non lo definirei necessariamente un miglioramento personale ricorsivo, ma uno sguardo al futuro.”Altman ha offerto una visione più ampia delle implicazioni della ricerca.”Quando si parla di automatizzare la ricerca a un livello tale da poterla immaginare, ci sono due aspetti di cui si parla”, ha detto Altman. “Il primo è: è possibile scrivere software, un’infrastruttura estremamente complessa, un software per eseguire processi di training su centinaia di migliaia di GPU e gestirle? Il secondo è: è possibile elaborare nuove idee scientifiche che rendano gli algoritmi più efficienti”.Ha osservato che OpenAI sta “osservando segnali precoci ma promettenti su entrambi i fronti”.La fine del debito tecnico? Gli agenti di intelligenza artificiale si occupano del lavoro che gli ingegneri odiano di piùUna delle applicazioni più inaspettate del Codex è stata quella di affrontare il debito tecnico, ovvero l’onere accumulato di manutenzione che affligge la maggior parte dei progetti software.Altman ha descritto come gli agenti di codifica dell’intelligenza artificiale eccellano in lavori poco attraenti che gli ingegneri umani solitamente evitano.”Il tipo di lavoro che gli ingegneri umani odiano fare – ristrutturare questo, ripulire questa base di codice, riscrivere questo, scrivere questo test – è dove al modello non importa. Il modello farà qualsiasi cosa, che sia divertente o no”, ha detto Altman.Ha riferito che alcuni team di infrastrutture di OpenAI che “avevano in un certo senso perso la speranza di poter vincere a lungo termine la guerra contro il debito tecnologico, ora pensano: vinceremo, perché il modello lavorerà costantemente dietro di noi, assicurandoci di avere un’ottima copertura di test e di effettuare il refactoring quando necessario”.L’osservazione si collega a un tema più ampio emerso ripetutamente durante il briefing: gli agenti di programmazione AI non sperimentano le fluttuazioni motivazionali che colpiscono i programmatori umani. Come ha osservato Altman, un membro del team ha recentemente osservato che “l’adattamento mentale più difficile da affrontare nel lavorare con questi compagni di programmazione AI, a differenza di un essere umano, è che i modelli non esauriscono la dopamina. Continuano a provare. Non perdono la motivazione. Non perdono energie quando qualcosa non funziona. Continuano e basta e, sai, trovano il modo di farlo”.Quanto costa l’app Codex e chi può usarla da oggiL’ app Codex è disponibile oggi su macOS ed è disponibile per chiunque abbia un abbonamento a ChatGPT Plus, Pro, Business, Enterprise o Edu. L’utilizzo è incluso negli abbonamenti a ChatGPT, con la possibilità di acquistare crediti aggiuntivi, se necessario.A scopo promozionale, OpenAI renderà temporaneamente disponibile Codex agli utenti di ChatGPT Free e Go “per aiutare più persone a provare i flussi di lavoro agentici”. L’azienda raddoppierà anche i limiti di tariffazione per gli utenti Codex esistenti su tutti i piani a pagamento durante questo periodo promozionale.La strategia di prezzo riflette la determinazione di OpenAI a far sì che Codex diventi lo strumento predefinito per lo sviluppo assistito dall’intelligenza artificiale, prima che i concorrenti possano guadagnare ulteriore terreno. Oltre un milione di sviluppatori hanno utilizzato Codex nell’ultimo mese e l’utilizzo è quasi raddoppiato dal lancio di GPT-5.2-Codex a metà dicembre, con una crescita di oltre 20 volte rispetto ad agosto 2025.Tra i clienti che utilizzano Codex figurano grandi aziende come Cisco, Ramp, Virgin Atlantic, Vanta, Duolingo e Gap, oltre a startup come Harvey, Sierra e Wonderful. Anche singoli sviluppatori hanno adottato lo strumento: Peter Steinberger , creatore di OpenClaw, ha sviluppato il progetto interamente con Codex e riferisce che, da quando è passato completamente allo strumento, la sua produttività è quasi raddoppiata, con oltre 82.000 contributi su GitHub.L’ambiziosa roadmap di OpenAI: supporto Windows, trigger cloud e agenti in background continuiOpenAI ha delineato una roadmap di sviluppo aggressiva per Codex. L’azienda prevede di rendere l’app disponibile su Windows, continuare a spingere “la frontiera delle capacità dei modelli” e implementare un’inferenza più rapida.All’interno dell’app, OpenAI “continuerà a perfezionare i flussi di lavoro multi-agente in base al feedback del mondo reale” e sta “sviluppando automazioni con supporto per trigger basati su cloud, in modo che Codex possa essere eseguito continuamente in background, non solo quando il computer è aperto”.L’azienda ha anche annunciato una nuova funzionalità, la “modalità di pianificazione”, che consente a Codex di leggere modifiche complesse in modalità di sola lettura, per poi discuterne con l’utente prima di eseguirle. “Questo significa che consente di acquisire una notevole sicurezza prima di inviarlo a svolgere gran parte del lavoro da solo, in modo indipendente, in parallelo con l’utente”, ha spiegato Embiricos.Inoltre, OpenAI sta introducendo personalità personalizzabili per Codex. “La personalità predefinita per Codex è piuttosto concisa. A molti piace, ma alcuni vorrebbero qualcosa di più coinvolgente”, ha affermato Embiricos. Gli utenti possono accedere alle nuove personalità utilizzando il comando /personality.Altman ha anche accennato a una futura integrazione con l’ecosistema più ampio di ChatGPT.”Col tempo potremo fare un sacco di cose interessanti per collegare gli account ChatGPT delle persone e sfruttare tutta la storia che hanno costruito lì”, ha affermato Altman.Microsoft domina ancora l’intelligenza artificiale aziendale, ma la finestra per la rivoluzione è aperta
Il lancio dell’app Codex avviene in un momento in cui la maggior parte delle aziende ha abbandonato le strategie basate su un singolo fornitore. Secondo il sondaggio di Andreessen Horowitz, “l’81% utilizza ora tre o più famiglie di modelli in fase di test o produzione, rispetto al 68% di meno di un anno fa”.Nonostante la proliferazione di strumenti di programmazione basati sull’intelligenza artificiale, Microsoft continua a dominare l’adozione aziendale grazie alle sue relazioni consolidate. “Microsoft 365 Copilot è leader nella chat aziendale, sebbene ChatGPT abbia colmato significativamente il divario” e “Github Copilot è ancora leader nella programmazione per le aziende”. Il sondaggio ha rilevato che “il 65% delle aziende ha dichiarato di preferire le soluzioni tradizionali quando disponibili”, citando fiducia, integrazione e semplicità di approvvigionamento.Tuttavia, il sondaggio suggerisce anche significative opportunità per i nuovi arrivati: “Le aziende affermano costantemente di apprezzare un’innovazione più rapida, una maggiore attenzione all’intelligenza artificiale e una maggiore flessibilità, abbinate alle capacità all’avanguardia che le startup native dell’intelligenza artificiale offrono”.OpenAI sembra posizionare Codex come un ponte tra questi mondi. “Codex si basa su una semplice premessa: tutto è controllato dal codice”, ha dichiarato l’azienda. “Più un agente è bravo a ragionare e produrre codice, più diventa capace di affrontare tutte le forme di lavoro tecnico e cognitivo”.L’ambizione dell’azienda va oltre la programmazione. “Ci siamo concentrati sul rendere Codex il miglior agente di programmazione, il che ha anche gettato le basi per renderlo un valido agente per un’ampia gamma di attività di knowledge work che vanno oltre la scrittura di codice.”Alla domanda se gli strumenti di codifica dell’intelligenza artificiale potrebbero un giorno andare oltre la fascia dei primi utilizzatori e diventare mainstream, Altman ha suggerito che la transizione potrebbe essere più vicina di quanto molti si aspettino.”Si può passare dal vibe coding all’ingegneria del software seria? Ecco di cosa si tratta”, ha detto Altman. “Penso che abbiamo superato il limite. Credo che questo sarà il modo in cui la maggior parte dei programmatori seri svolgerà il proprio lavoro, e molto rapidamente da ora in poi.”Passò poi a una previsione ancora più audace: il codice stesso avrebbe potuto diventare l’interfaccia universale per tutto il lavoro basato sul computer.”Il codice è un linguaggio universale che permette ai computer di fare ciò che si vuole. Ed è diventato così efficace che penso che, molto rapidamente, potremo passare non solo dal programmare in modo fluido app stupide, ma a svolgere tutto il lavoro di conoscenza non di programmazione”, ha affermato Altman.Al termine del briefing, Altman ha esortato i giornalisti a provare personalmente il prodotto: “Per favore, provate l’app. Non c’è modo di far capire questo semplicemente parlandone. È una potenza pazzesca”.Per gli sviluppatori che hanno trascorso la loro carriera imparando a scrivere codice, il messaggio era chiaro: il futuro appartiene a coloro che imparano a gestire le macchine che lo scrivono per loro.