OpenAI a publié une version améliorée de son modèle de codage, GPT-5.2-Codex, conçu pour gérer des tâches complexes d’ingénierie logicielle avec des fonctionnalités de cybersécurité améliorées. Cette nouvelle itération s’appuie sur les capacités de GPT-5.2 et est optimisée pour les cas d’utilisation « agentiques » – où l’IA gère de manière autonome des projets de codage à long terme. Les améliorations sont importantes car à mesure que l’IA s’améliore en matière de codage, elle devient également un outil plus puissant d’attaque et de défense en matière de cybersécurité.

Capacités de cybersécurité améliorées

GPT-5.2-Codex est commercialisé comme le modèle le plus avancé d’OpenAI à ce jour pour les travaux de cybersécurité. La société l’a testé par rapport aux références du secteur, notamment les défis Capture-the-Flag (CTF), CVE-Bench (découverte de vulnérabilités) et les simulations Cyber ​​Range.

  • Évaluations CTF : Le modèle a atteint des performances optimales, attribuées au « compactage » – sa capacité à maintenir un fonctionnement cohérent sur plusieurs longues fenêtres contextuelles.
  • CVE-Bench : Il a obtenu un score de 87 %, surpassant les modèles précédents, ce qui peut accélérer l’approche par force brute pour trouver des vulnérabilités.
  • Cyber ​​Range : Le modèle a atteint un taux de réussite de 72,7 %, légèrement inférieur aux 81,8 % de GPT-5.1-Codex-Max.

OpenAI reconnaît la nature à double usage de ces capacités : la même IA qui peut identifier les failles peut également les exploiter. Pour atténuer les risques, la société teste un programme « d’accès sécurisé » destiné aux professionnels de la cybersécurité agréés, leur permettant de tester tout le potentiel du modèle sans restrictions. Cette approche reconnaît que la sécurité défensive nécessite des outils dotés de capacités similaires à celles utilisées par les attaquants.

Codage agent et travail à long horizon

Une avancée clé de GPT-5.2-Codex est sa capacité à gérer la refactorisation de logiciels, les migrations et la création de fonctionnalités à grande échelle sur des périodes prolongées. La fonction « compactage » garantit que le modèle conserve son contexte même lors de projets complexes en plusieurs étapes. Ceci est essentiel pour les entreprises qui s’appuient sur l’IA pour automatiser ou accélérer le développement de logiciels, car cela réduit le risque d’erreurs ou de perte de progrès.

OpenAI met en avant un exemple concret : un chercheur en sécurité utilisant GPT-5.1-Codex-Max a découvert une vulnérabilité dans le code React, démontrant le potentiel du modèle pour la recherche de vulnérabilités. L’entreprise s’efforce désormais d’équilibrer l’accessibilité et la sécurité, reconnaissant que trop restreindre les capacités de l’IA peut entraver les efforts défensifs de cybersécurité.

Accès contrôlé et déploiement futur

Actuellement, GPT-5.2-Codex est disponible pour les utilisateurs payants de ChatGPT. OpenAI prévoit de déployer l’accès aux API dans les semaines à venir, avec une approche progressive qui donne la priorité à la sécurité. Le programme pilote d’accès sécurisé fournira à certains utilisateurs des modèles plus permissifs pour le travail défensif de cybersécurité, tandis qu’OpenAI continue d’évaluer les risques.

“Les équipes de sécurité peuvent se heurter à des restrictions lorsqu’elles tentent d’imiter les acteurs malveillants… Nous développons un projet pilote d’accès fiable pour éliminer ces frictions pour les utilisateurs éligibles.”

L’approche d’OpenAI reflète une reconnaissance croissante du fait que contrôler le développement de l’IA ne consiste pas seulement à prévenir les abus, mais également à permettre une recherche et une défense responsables en matière de sécurité. Le cadre de préparation de l’entreprise continuera à guider les décisions de déploiement à mesure que les modèles deviendront plus puissants.

GPT-5.2-Codex représente une avancée significative dans l’ingénierie logicielle assistée par l’IA, mais son véritable impact dépendra de la manière dont OpenAI gère les compromis entre innovation et sécurité. La capacité du modèle à gérer des tâches complexes à long terme avec des fonctionnalités de cybersécurité améliorées le positionne comme un outil précieux pour les entreprises, à condition que son déploiement reste soigneusement contrôlé.