OpenAI udostępniło zaktualizowaną wersję swojego modelu kodowania, GPT-5.2-Codex, zaprojektowaną w celu rozwiązywania złożonych problemów związanych z tworzeniem oprogramowania z ulepszonymi funkcjami cyberbezpieczeństwa. Ta nowa iteracja opiera się na możliwościach GPT-5.2 i jest zoptymalizowana pod kątem zastosowań „opartych na agentach”, w których sztuczna inteligencja autonomicznie zarządza długoterminowymi projektami kodowania. Te ulepszenia są ważne, ponieważ w miarę jak sztuczna inteligencja staje się coraz lepsza w kodowaniu, staje się także potężniejszym narzędziem zarówno do ataku, jak i obrony w cyberbezpieczeństwie.
Ulepszone możliwości cyberbezpieczeństwa
GPT-5.2-Codex jest pozycjonowany przez OpenAI jako najbardziej zaawansowany model do pracy w cyberbezpieczeństwie. Firma przetestowała go pod kątem standardów branżowych, w tym konkursów Capture-the-Flag (CTF), CVE-Bench (wykrywanie podatności) i symulacji Cyber Range.
- Wynik CTF: Model wykazał najlepsze wyniki, co można wytłumaczyć „kompaktowością” – jego zdolnością do wspierania skoordynowanej pracy w kilku długich oknach kontekstowych.
- CVE-Bench: Uzyskał 87% punktów, przewyższając poprzednie modele, co może przyspieszyć wyszukiwanie luk metodą brute-force.
- Cyber Range: Model przeszedł 72,7% przypadków, czyli nieco mniej niż GPT-5.1-Codex-Max (81,8%).
OpenAI dostrzega podwójny cel tych możliwości: ta sama sztuczna inteligencja, która potrafi identyfikować wady, może je również wykorzystywać. Aby ograniczyć ryzyko, firma uruchamia pilotażowy program „zaufanego dostępu” dla sprawdzonych specjalistów ds. cyberbezpieczeństwa, umożliwiający im przetestowanie pełnego potencjału modelu bez ograniczeń. W podejściu tym uznaje się, że bezpieczeństwo obronne wymaga narzędzi o możliwościach podobnych do narzędzi atakujących.
Kodowanie agentów i długoterminowa wydajność
Kluczowym osiągnięciem GPT-5.2-Codex jest jego zdolność do obsługi refaktoryzacji oprogramowania na dużą skalę, migracji i rozwoju nowych funkcji przez długi czas. Kompaktowość zapewnia, że model zachowuje kontekst nawet podczas złożonych, wielofazowych projektów. Ma to kluczowe znaczenie dla firm, które polegają na sztucznej inteligencji w celu automatyzacji lub przyspieszania tworzenia oprogramowania, ponieważ zmniejsza ryzyko błędów lub utraty postępów.
OpenAI podaje przykład z życia wzięty: badacz bezpieczeństwa korzystający z GPT-5.1-Codex-Max odkrył lukę w kodzie React, demonstrując potencjał modelu do badania podatności. Firma pracuje obecnie nad zrównoważeniem dostępności i bezpieczeństwa, mając świadomość, że nadmierne ograniczanie możliwości sztucznej inteligencji może utrudnić wysiłki obronne w zakresie cyberbezpieczeństwa.
Kontrolowany dostęp i przyszłe wdrożenia
GPT-5.2-Codex jest obecnie dostępny dla użytkowników płatnej wersji ChatGPT. OpenAI planuje udostępnianie dostępu API w nadchodzących tygodniach etapami, przy czym bezpieczeństwo będzie najwyższym priorytetem. Program pilotażowy „zaufanego dostępu” zapewni wybranym użytkownikom bardziej liberalne modele do defensywnej pracy nad cyberbezpieczeństwem, podczas gdy OpenAI będzie w dalszym ciągu oceniać ryzyko.
„Zespoły ds. bezpieczeństwa mogą napotkać ograniczenia, próbując naśladować działania atakujących… Opracowujemy program pilotażowy Zaufanego dostępu, aby usunąć te bariery dla wykwalifikowanych użytkowników”.
Podejście OpenAI odzwierciedla rosnącą świadomość, że kontrolowanie rozwoju sztucznej inteligencji nie polega tylko na zapobieganiu nadużyciom, ale także na zapewnieniu odpowiedzialnych badań w zakresie bezpieczeństwa i obronności. Ramy przygotowawcze firmy będą w dalszym ciągu wpływać na decyzje dotyczące wdrożenia, w miarę jak modele będą coraz potężniejsze.
Kodeks GPT-5.2 stanowi znaczący krok naprzód w rozwoju oprogramowania obsługującego sztuczną inteligencję, ale jego prawdziwy wpływ będzie zależał od tego, jak OpenAI poradzi sobie z kompromisami między innowacją a bezpieczeństwem. Zdolność modelu do radzenia sobie ze złożonymi wyzwaniami przez długi czas dzięki ulepszonym funkcjom cyberbezpieczeństwa sprawia, że jest to cenne narzędzie dla przedsiębiorstw, pod warunkiem, że jego wdrażanie będzie dokładnie kontrolowane.
