OpenAI heeft een verbeterde versie van zijn codeermodel, GPT-5.2-Codex, uitgebracht, ontworpen om complexe software-engineeringtaken uit te voeren met verbeterde cyberbeveiligingsfuncties. Deze nieuwe iteratie bouwt voort op de mogelijkheden van GPT-5.2 en is geoptimaliseerd voor ‘agentische’ gebruiksscenario’s – waarbij AI autonoom langetermijncoderingsprojecten beheert. De verbeteringen zijn van belang omdat naarmate AI beter wordt in het coderen, het ook een krachtiger hulpmiddel wordt voor zowel aanval als verdediging op het gebied van cyberbeveiliging.
Verbeterde cyberbeveiligingsmogelijkheden
GPT-5.2-Codex wordt op de markt gebracht als OpenAI’s meest geavanceerde model tot nu toe voor cyberbeveiligingswerk. Het bedrijf heeft het getest aan de hand van branchebenchmarks, waaronder Capture-the-Flag (CTF)-uitdagingen, CVE-Bench (ontdekking van kwetsbaarheden) en Cyber Range-simulaties.
- CTF-evaluaties: Het model behaalde topprestaties, toegeschreven aan “verdichting”: het vermogen om een coherente werking over meerdere lange contextvensters te behouden.
- CVE-Bench: Het scoorde 87% en presteerde beter dan eerdere modellen, wat de brute-force-aanpak voor het vinden van kwetsbaarheden kan versnellen.
- Cyberbereik: Het model behaalde een slagingspercentage van 72,7%, iets lager dan de 81,8% van GPT-5.1-Codex-Max.
OpenAI erkent het tweeledige karakter van deze mogelijkheden: dezelfde AI die fouten kan identificeren, kan deze ook exploiteren. Om de risico’s te beperken, voert het bedrijf een pilot uit met een ‘trusted access’-programma voor doorgelichte cyberbeveiligingsprofessionals, waardoor ze het volledige potentieel van het model zonder beperkingen kunnen testen. Deze aanpak erkent dat defensieve beveiliging tools vereist met vergelijkbare mogelijkheden als die welke door aanvallers worden gebruikt.
Agentische codering en werken met een lange horizon
Een belangrijke vooruitgang in GPT-5.2-Codex is het vermogen om grootschalige software-refactoring, migraties en feature-builds over langere perioden uit te voeren. De “verdichtings”-functie zorgt ervoor dat het model de context behoudt, zelfs tijdens complexe projecten die uit meerdere fasen bestaan. Dit is van cruciaal belang voor ondernemingen die afhankelijk zijn van AI om de softwareontwikkeling te automatiseren of te versnellen, omdat het de kans op fouten of verlies van voortgang verkleint.
OpenAI benadrukt een voorbeeld uit de praktijk: een beveiligingsonderzoeker die GPT-5.1-Codex-Max gebruikte, ontdekte een kwetsbaarheid in React-code, wat het potentieel van het model voor onderzoek naar kwetsbaarheden aantoont. Het bedrijf werkt nu aan een evenwicht tussen toegankelijkheid en veiligheid, waarbij het erkent dat het te veel beperken van AI-mogelijkheden defensieve cyberbeveiligingsinspanningen kan belemmeren.
Gecontroleerde toegang en toekomstige implementatie
Momenteel is GPT-5.2-Codex beschikbaar voor betaalde ChatGPT-gebruikers. OpenAI is van plan de komende weken API-toegang uit te rollen, met een gefaseerde aanpak waarbij veiligheid voorop staat. Het pilotprogramma voor vertrouwde toegang zal geselecteerde gebruikers meer tolerante modellen bieden voor defensief cyberbeveiligingswerk, terwijl OpenAI de risico’s blijft evalueren.
“Beveiligingsteams kunnen beperkingen tegenkomen bij hun poging om bedreigingsactoren te emuleren… We ontwikkelen een pilot voor vertrouwde toegang om die wrijving weg te nemen voor in aanmerking komende gebruikers.”
De aanpak van OpenAI weerspiegelt een groeiende erkenning dat het beheersen van de ontwikkeling van AI niet alleen gaat over het voorkomen van misbruik, maar ook over het mogelijk maken van verantwoord veiligheidsonderzoek en defensie. Het Preparedness Framework van het bedrijf zal de implementatiebeslissingen blijven begeleiden naarmate de modellen krachtiger worden.
GPT-5.2-Codex vertegenwoordigt een belangrijke stap voorwaarts in AI-ondersteunde software-engineering, maar de werkelijke impact ervan zal afhangen van hoe OpenAI de wisselwerking tussen innovatie en veiligheid beheert. Het vermogen van het model om complexe taken op lange termijn af te handelen met verbeterde cyberbeveiligingsfuncties positioneert het als een waardevol instrument voor ondernemingen, op voorwaarde dat de implementatie ervan zorgvuldig gecontroleerd blijft.






























