OpenAI выпустила обновленную версию своей кодирующей модели, GPT-5.2-Codex, разработанную для решения сложных задач в области разработки программного обеспечения с улучшенными функциями кибербезопасности. Эта новая итерация основана на возможностях GPT-5.2 и оптимизирована для «агентных» сценариев использования, где ИИ автономно управляет долгосрочными проектами кодирования. Эти улучшения важны, поскольку по мере того, как ИИ становится лучше в кодировании, он также превращается в более мощный инструмент как для атак, так и для защиты в кибербезопасности.
Улучшенные Возможности Кибербезопасности
GPT-5.2-Codex позиционируется OpenAI как их самая продвинутая модель для работы в области кибербезопасности. Компания протестировала её по отраслевым стандартам, включая соревнования Capture-the-Flag (CTF), CVE-Bench (обнаружение уязвимостей) и симуляции Cyber Range.
- CTF-оценка: Модель показала лучшие результаты, что объясняется «компакцией» — её способностью поддерживать согласованную работу в нескольких длинных контекстных окнах.
- CVE-Bench: Она набрала 87%, превзойдя предыдущие модели, что может ускорить грубый перебор для поиска уязвимостей.
- Cyber Range: Модель прошла 72,7% случаев, что немного ниже, чем у GPT-5.1-Codex-Max (81,8%).
OpenAI признает двойное назначение этих возможностей: тот же ИИ, который может выявлять недостатки, также может их использовать. Чтобы снизить риски, компания запускает пилотную программу «доверенного доступа» для проверенных специалистов по кибербезопасности, позволяя им тестировать весь потенциал модели без ограничений. Такой подход признает, что для оборонительной безопасности необходимы инструменты с аналогичными возможностями, как и у злоумышленников.
Агентное Кодирование и Долгосрочная Работа
Ключевым достижением GPT-5.2-Codex является его способность справляться с масштабными рефакторингами программного обеспечения, миграциями и разработкой новых функций в течение длительных периодов времени. Функция «компакции» гарантирует, что модель сохраняет контекст даже во время сложных многоэтапных проектов. Это критически важно для предприятий, которые полагаются на ИИ для автоматизации или ускорения разработки программного обеспечения, поскольку это снижает риск ошибок или потери прогресса.
OpenAI приводит реальный пример: исследователь по безопасности, используя GPT-5.1-Codex-Max, обнаружил уязвимость в коде React, демонстрируя потенциал модели для исследований в области уязвимостей. Компания сейчас работает над балансированию доступности и безопасности, признавая, что чрезмерное ограничение возможностей ИИ может помешать оборонительным усилиям в области кибербезопасности.
Контролируемый Доступ и Будущее Развертывание
В настоящее время GPT-5.2-Codex доступен пользователям платной версии ChatGPT. OpenAI планирует развернуть доступ к API в ближайшие недели, поэтапно, уделяя первоочередное внимание безопасности. Пилотная программа «доверенного доступа» предоставит избранным пользователям более разрешительные модели для оборонительной работы в области кибербезопасности, в то время как OpenAI продолжает оценивать риски.
«Команды безопасности могут сталкиваться с ограничениями при попытке эмулировать действия злоумышленников… Мы разрабатываем пилотную программу доверенного доступа, чтобы устранить эти препятствия для квалифицированных пользователей».
Подход OpenAI отражает растущее осознание того, что контроль над развитием ИИ заключается не только в предотвращении злоупотреблений, но и в обеспечении ответственных исследований в области безопасности и обороны. Подготовительная структура компании продолжит определять решения о развертывании по мере того, как модели становятся более мощными.
GPT-5.2-Codex представляет собой значительный шаг вперед в ИИ-поддерживаемой разработке программного обеспечения, но его истинное влияние будет зависеть от того, как OpenAI справится с компромиссами между инновациями и безопасностью. Способность модели справляться со сложными задачами в течение длительного времени с улучшенными функциями кибербезопасности делает её ценным инструментом для предприятий, при условии, что её развертывание останется тщательно контролируемым.
