OpenAI telah merilis versi terbaru dari model pengkodeannya, GPT-5.2-Codex, yang dirancang untuk menangani tugas rekayasa perangkat lunak yang kompleks dengan fitur keamanan siber yang ditingkatkan. Iterasi baru ini dibangun berdasarkan kemampuan GPT-5.2 dan dioptimalkan untuk kasus penggunaan “agentik” – di mana AI secara mandiri mengelola proyek coding jangka panjang. Peningkatan ini penting karena ketika AI menjadi lebih baik dalam pengkodean, AI juga menjadi alat yang lebih kuat untuk serangan dan pertahanan dalam keamanan siber.

Peningkatan Kemampuan Keamanan Siber

GPT-5.2-Codex dipasarkan sebagai model OpenAI yang paling canggih untuk pekerjaan keamanan siber. Perusahaan mengujinya berdasarkan tolok ukur industri, termasuk tantangan Capture-the-Flag (CTF), CVE-Bench (penemuan kerentanan), dan simulasi Cyber ​​Range.

  • Eval CTF: Model ini mencapai performa terbaik, yang dikaitkan dengan “pemadatan” – kemampuannya untuk mempertahankan operasi yang koheren di beberapa jendela konteks yang panjang.
  • CVE-Bench: Skornya sebesar 87%, mengungguli model sebelumnya, sehingga dapat mempercepat pendekatan brute force untuk menemukan kerentanan.
  • Rentang Dunia Maya: Model ini mencapai tingkat kelulusan sebesar 72,7%, sedikit lebih rendah dibandingkan GPT-5.1-Codex-Max sebesar 81,8%.

OpenAI menyadari sifat penggunaan ganda dari kemampuan ini: AI yang dapat mengidentifikasi kelemahan juga dapat mengeksploitasinya. Untuk memitigasi risiko, perusahaan ini sedang menguji coba program “akses tepercaya” bagi para profesional keamanan siber yang terverifikasi, sehingga mereka dapat menguji potensi penuh model tersebut tanpa batasan. Pendekatan ini mengakui bahwa keamanan defensif memerlukan alat dengan kemampuan serupa dengan yang digunakan oleh penyerang.

Pengodean Agentik dan Pekerjaan Jangka Panjang

Kemajuan utama dalam GPT-5.2-Codex adalah kemampuannya untuk menangani pemfaktoran ulang, migrasi, dan pembuatan fitur perangkat lunak berskala besar dalam jangka waktu yang lama. Fitur “pemadatan” memastikan model mempertahankan konteks bahkan selama proyek multi-tahap yang kompleks. Hal ini penting bagi perusahaan yang mengandalkan AI untuk mengotomatisasi atau mempercepat pengembangan perangkat lunak, karena hal ini mengurangi risiko kesalahan atau hilangnya kemajuan.

OpenAI menyoroti contoh dunia nyata: seorang peneliti keamanan yang menggunakan GPT-5.1-Codex-Max menemukan kerentanan dalam kode React, yang menunjukkan potensi model tersebut untuk penelitian kerentanan. Perusahaan kini berupaya menyeimbangkan aksesibilitas dengan keamanan, menyadari bahwa terlalu membatasi kemampuan AI dapat menghambat upaya defensif keamanan siber.

Akses Terkendali dan Penerapan di Masa Mendatang

Saat ini, GPT-5.2-Codex tersedia untuk pengguna ChatGPT berbayar. OpenAI berencana meluncurkan akses API dalam beberapa minggu mendatang, dengan pendekatan bertahap yang mengutamakan keselamatan. Program percontohan akses tepercaya akan memberikan model yang lebih permisif kepada pengguna terpilih untuk pekerjaan keamanan siber defensif, sementara OpenAI terus mengevaluasi risikonya.

“Tim keamanan dapat mengalami pembatasan ketika mencoba meniru pelaku ancaman… Kami sedang mengembangkan uji coba akses tepercaya untuk menghilangkan hambatan tersebut bagi pengguna yang memenuhi syarat.”

Pendekatan OpenAI mencerminkan semakin besarnya kesadaran bahwa pengendalian pengembangan AI bukan hanya tentang mencegah penyalahgunaan namun juga memungkinkan dilakukannya penelitian keamanan dan pertahanan yang bertanggung jawab. Kerangka Kesiapsiagaan perusahaan akan terus memandu keputusan penerapan seiring dengan semakin canggihnya model.

GPT-5.2-Codex mewakili langkah maju yang signifikan dalam rekayasa perangkat lunak yang dibantu AI, namun dampak sebenarnya akan bergantung pada cara OpenAI mengelola trade-off antara inovasi dan keamanan. Kemampuan model ini untuk menangani tugas-tugas kompleks dan jangka panjang dengan fitur keamanan siber yang ditingkatkan menjadikannya sebagai alat yang berharga bagi perusahaan, asalkan penerapannya tetap dikontrol dengan cermat.