avec récent Sortie de GPT 5.2OpenAI a mis à jour d’autres modèles connexes, notamment Codex, son modèle de codage populaire, intégrant davantage de cas d’utilisation agentiques.
GPT-5.2-Codex, appelé OpenAI dans un article de blog « Le modèle de codage agent le plus avancé à ce jour pour les ingénieurs logiciels complexes du monde réel » est optimisé pour le travail à long terme avec des agents et disposera de solides capacités de cybersécurité.
Le modèle est une branche de GPT-5.2, optimisée pour la construction agentique.
« GPT‑5.2-Codex représente un pas en avant dans la manière dont l’IA avancée peut prendre en charge des domaines spécialisés tels que l’ingénierie logicielle et la cybersécurité du monde réel, en aidant les développeurs et les défenseurs à s’attaquer à des tâches complexes à long terme et en renforçant les outils disponibles pour une recherche responsable en matière de sécurité », a déclaré la société dans son blog.
Les entreprises “peuvent accéder au nouveau modèle de codec sur toutes les surfaces de codec pour les utilisateurs payants de ChatGPT et s’efforcent de permettre un accès sécurisé à GPT-5.2-Codex pour les utilisateurs d’API dans les semaines à venir”. La société gère un programme avec des utilisateurs de confiance sur invitation uniquement pour accéder à un « modèle plus permissif pour les professionnels et les organisations approuvés » pour un travail défensif de cybersécurité afin d’équilibrer l’accessibilité et la sécurité.
Avancées en cybersécurité avec des modèles
OpenAI considère le GPT-5.2-Codex comme son modèle de cybersécurité le plus robuste à ce jour. Néanmoins, à mesure que ses capacités augmentent, l’entreprise affirme qu’elle doit concevoir une approche de déploiement qui tienne compte de la croissance future et prenne en charge la cybersécurité défensive.
“À mesure que nos modèles continuent de progresser dans le domaine du renseignement, nous avons remarqué que ces améliorations se traduisent également par des capacités accrues dans des domaines spécialisés comme la cybersécurité.”
Dr OpenAI sur sa carte système qu’il a testé le modèle sur trois benchmarks : l’évaluation de capture du drapeau (CTF), le banc CVE et la cyber-gamme.
Le codex GPT-5.2 est devenu le modèle le plus performant de l’entreprise dans l’évaluation CTF, qu’ils ont attribué au compactage, ou « à la capacité de fonctionner de manière cohérente sur plusieurs fenêtres contextuelles ».
Le modèle a obtenu un score de 87 % sur CVE-Bench, surpassant les autres modèles, suivi de près par GPT-5.1-Codex-Max. Cette amélioration sera utile pour les tâches impliquant l’exécution de commandes autour des outils de découverte et de test de vulnérabilités « avec une approche presque brutale ».
Dans le test long de cyber-portée, le modèle avait un taux de réussite combiné de 72,7 %. GPT-5.1-Codex-Max a obtenu un score de 81,8 %.
Projets de déploiement de cybersécurité
OpenAI rapporte que certains utilisateurs de son gpt-5.1-codex-max, qui a été lancé en novembreUne exposition du code source dans React a découvert la vulnérabilité et l’a ensuite signalée. Andrew McPherson, chercheur en sécurité chez Privy, a utilisé GPT-5.1-Codex-Max pour évaluer dans quelle mesure le modèle pouvait prendre en charge la recherche de vulnérabilités dans le monde réel, selon OpenAI. Le modèle a plutôt révélé un comportement inattendu.
Avec les améliorations apportées aux capacités de cybersécurité pour GPT-5.2-Codex et potentiellement les modèles qui suivront, OpenAI a déclaré qu’il devait équilibrer le déploiement de modèles frontières avec les outils nécessaires à la cybersécurité défensive. Bien que GPT-5.2-Codex « n’atteint pas le niveau élevé de cybercapacités dans le cadre de notre cadre de préparation », la société prévoit d’amener certains utilisateurs à tester les capacités de sécurité. (d’OpenAI Cadre de préparation pour mesurer et suivre les dommages potentiels causés à l’homme par l’IA)
« Les équipes de sécurité peuvent se heurter à des restrictions lorsqu’elles tentent de simuler des acteurs malveillants, d’analyser des logiciels malveillants pour prendre en charge des mesures correctives ou de tester des infrastructures critiques. Nous construisons un projet pilote d’accès sécurisé pour permettre aux utilisateurs qualifiés et aux organisations d’utiliser les cybercapacités de l’IA de pointe pour éliminer ces frictions et accélérer les défenseurs de confiance. Dr OpenAI.
frontière d’agent
GPT-5.2 déjà A reçu les éloges des utilisateurs Pour son utilisation dans les opérations commerciales et les flux de travail. Avec la version Codex, certaines de ces fonctionnalités pourraient migrer, d’autant plus que les entreprises envisagent d’utiliser le modèle pour coder leurs agents.
La société affirme que le modèle améliore le travail à long terme grâce au compactage, offrant ainsi des performances robustes en cas de modifications importantes du code. Il présente également des performances améliorées sous Windows.
Lors des tests de référence, le codex GPT-5.2 a obtenu de meilleurs résultats en termes de précision que ses versions précédentes.
“Grâce à ces améliorations, Codex est plus capable de travailler sur de grands référentiels lors de sessions étendues avec l’intégralité du contexte intact. Il peut effectuer des tâches complexes telles que de grandes refactorisations, des migrations de code et des builds de fonctionnalités de manière plus fiable – en continuant à itérer sans perdre le fil, même si les plans changent ou si les tentatives échouent”, explique OpenAI.
Depuis son lancement Aperçu en maiCodex Enterprise AI Builder a aidé à adopter le codage Agentic et Vibe dans l’espace. Avec Windsurf, Cursor, Claude Code et de nombreux autres agents de codage de Google, la plate-forme éloigne le LLM de la simple complétion de code pour permettre aux utilisateurs de créer et de lancer des projets de codage asynchrone.






