Anthropic telah merilis pembaruan besar pada model AI Claude Sonnet, versi 4.6, yang menjadikan kemampuannya lebih dekat dengan model Opus premium. Peningkatan ini berfokus pada peningkatan kemampuan AI untuk berinteraksi dengan lingkungan digital—pada dasarnya, menggunakan komputer seperti yang dilakukan manusia.

Peningkatan Utama: Sistem Operasi dan Pengodean

Kemajuan yang paling menonjol adalah kinerja Sonnet 4.6 dalam tolok ukur OSWorld, yang menunjukkan kemahiran dasar manusia dalam tugas-tugas sistem operasi. Tidak seperti banyak model AI lainnya yang memerlukan alat atau konektor khusus, Sonnet 4.6 dapat mengisi formulir, menavigasi antar tab browser, dan mengikuti instruksi dalam spreadsheet secara langsung—semuanya tanpa perangkat lunak tambahan.

Model ini juga menunjukkan peningkatan substansial dalam kemampuan coding. Sekarang ia mengikuti instruksi terperinci dengan presisi lebih tinggi dan dapat menangani data dalam jumlah besar dalam satu permintaan, berkat pengujian beta pada jendela konteks 1 juta token. Ini berarti pengguna dapat menyediakan basis kode atau dokumen yang luas untuk analisis dan modifikasi.

Peningkatan Keamanan: Bertahan Terhadap Injeksi Segera

Aspek penting dari pembaruan ini adalah peningkatan keamanan terhadap serangan injeksi cepat. Serangan-serangan ini mengeksploitasi kerentanan di mana perintah berbahaya disembunyikan dalam teks yang tampaknya tidak berbahaya, yang kemudian dapat dieksekusi oleh AI. Anthropic melaporkan bahwa Sonnet 4.6 menunjukkan ketahanan yang jauh lebih baik terhadap ancaman ini, dan memiliki kinerja serupa dengan model Opus berbayar dalam hal ini.

Hal ini penting karena ketika AI memperoleh lebih banyak otonomi dalam lingkungan digital, risiko eksploitasi pun meningkat. AI yang disusupi berpotensi melakukan tindakan berbahaya tanpa pengawasan manusia.

Apa Artinya bagi Masa Depan

Kemajuan Anthropic mewakili peralihan ke arah model AI yang lebih serbaguna yang mampu menyelesaikan tugas di dunia nyata. Kemampuan untuk berinteraksi dengan sistem operasi secara alami menurunkan hambatan terhadap otomatisasi dan integrasi. Namun, hal ini juga menggarisbawahi kebutuhan mendesak akan langkah-langkah keamanan yang kuat untuk mencegah penyalahgunaan.

Peningkatan pada Sonnet 4.6 menandakan bahwa AI berkembang lebih dari sekadar respons sederhana menjadi peserta yang lebih aktif di dunia digital, sehingga potensi dan risikonya menjadi lebih nyata.