OpenAI ha lanzado una versión mejorada de su modelo de codificación, GPT-5.2-Codex, diseñada para manejar tareas complejas de ingeniería de software con características de ciberseguridad mejoradas. Esta nueva iteración se basa en las capacidades de GPT-5.2 y está optimizada para casos de uso “agentes”, donde la IA gestiona de forma autónoma proyectos de codificación a largo plazo. Las mejoras son importantes porque a medida que la IA mejora en la codificación, también se convierte en una herramienta más poderosa tanto para el ataque como para la defensa en ciberseguridad.
Capacidades de ciberseguridad mejoradas
GPT-5.2-Codex se comercializa como el modelo más avanzado de OpenAI hasta el momento para trabajos de ciberseguridad. La compañía lo probó con puntos de referencia de la industria, incluidos los desafíos Capture-the-Flag (CTF), CVE-Bench (descubrimiento de vulnerabilidades) y simulaciones Cyber Range.
- Evaluaciones CTF: El modelo logró un rendimiento superior, atribuido a la “compactación”: su capacidad para mantener una operación coherente en múltiples ventanas de contexto largas.
- CVE-Bench: Obtuvo una puntuación del 87 %, superando a los modelos anteriores, lo que puede acelerar el enfoque de fuerza bruta para encontrar vulnerabilidades.
- Cyber Range: El modelo logró una tasa de aprobación del 72,7 %, ligeramente inferior al 81,8 % de GPT-5.1-Codex-Max.
OpenAI reconoce la naturaleza de doble uso de estas capacidades: la misma IA que puede identificar fallas también puede explotarlas. Para mitigar los riesgos, la compañía está poniendo a prueba un programa de “acceso confiable” para profesionales de ciberseguridad examinados, lo que les permitirá probar todo el potencial del modelo sin restricciones. Este enfoque reconoce que la seguridad defensiva requiere herramientas con capacidades similares a las utilizadas por los atacantes.
Codificación agente y trabajo a largo plazo
Un avance clave en GPT-5.2-Codex es su capacidad para manejar refactorizaciones, migraciones y compilaciones de funciones de software a gran escala durante períodos prolongados. La función de “compactación” garantiza que el modelo conserve el contexto incluso durante proyectos complejos de varias etapas. Esto es fundamental para las empresas que dependen de la IA para automatizar o acelerar el desarrollo de software, ya que reduce el riesgo de errores o pérdida de progreso.
OpenAI destaca un ejemplo del mundo real: un investigador de seguridad que utiliza GPT-5.1-Codex-Max descubrió una vulnerabilidad en el código React, lo que demuestra el potencial del modelo para la investigación de vulnerabilidades. La compañía ahora está trabajando para equilibrar la accesibilidad con la seguridad, reconociendo que restringir demasiado las capacidades de la IA puede obstaculizar los esfuerzos de ciberseguridad defensiva.
Acceso controlado e implementación futura
Actualmente, GPT-5.2-Codex está disponible para usuarios pagos de ChatGPT. OpenAI planea implementar el acceso API en las próximas semanas, con un enfoque gradual que priorice la seguridad. El programa piloto de acceso confiable proporcionará a usuarios selectos modelos más permisivos para el trabajo de ciberseguridad defensiva, mientras OpenAI continúa evaluando los riesgos.
“Los equipos de seguridad pueden encontrarse con restricciones al intentar emular a los actores de amenazas… Estamos desarrollando un piloto de acceso confiable para eliminar esa fricción para los usuarios calificados”.
El enfoque de OpenAI refleja un reconocimiento cada vez mayor de que controlar el desarrollo de la IA no se trata sólo de prevenir el uso indebido, sino también de permitir una investigación y defensa responsables de la seguridad. El marco de preparación de la empresa seguirá guiando las decisiones de implementación a medida que los modelos se vuelvan más potentes.
GPT-5.2-Codex representa un importante paso adelante en la ingeniería de software asistida por IA, pero su verdadero impacto dependerá de cómo OpenAI gestione las compensaciones entre innovación y seguridad. La capacidad del modelo para manejar tareas complejas a largo plazo con características mejoradas de ciberseguridad lo posiciona como una herramienta valiosa para las empresas, siempre que su implementación se mantenga cuidadosamente controlada.
































