AISI menilai: kemampuan serangan siber GPT-5.5 setara dengan Anthropic Mythos

ChainNewsAbmedia

Institut Keamanan AI Inggris (AI Security Institute, AISI) pada 1 Mei merilis laporan penilaian kemampuan serangan siber terhadap OpenAI GPT-5.5. Laporan tersebut menyebut keberhasilan GPT-5.5 pada pengujian tingkat Expert sebesar 71,4%, sedangkan Anthropic Claude Mythos Preview 68,6%, dengan selisih masih berada dalam rentang kesalahan statistik. GPT-5.5 juga merupakan sistem AI kedua setelah Mythos yang mampu menyelesaikan sendiri simulasi penyerangan siber penuh perusahaan AISI 32 langkah “The Last Ones”. AISI memperingatkan bahwa ini menunjukkan kemajuan cepat kemampuan serangan AI kemungkinan merupakan “tren menyeluruh”, bukan peristiwa terobosan tunggal.

Pengujian tingkat Expert: 71,4% vs 68,6%, selisih masih dalam batas kesalahan

AISI adalah lembaga penelitian keamanan AI di bawah Kementerian Sains, Inovasi, dan Teknologi Inggris. Pengujian kali ini merupakan putaran evaluasi terbaru AISI terhadap kemampuan siber ofensif model frontier AI. Pada soal tingkat Expert tertinggi, tingkat keberhasilan rata-rata GPT-5.5 71,4%, Mythos Preview 68,6%; selisih keduanya berada dalam rentang kesalahan statistik. Artinya, kemampuan serangan siber model unggulan OpenAI dan Anthropic saat ini sudah praktis setara.

Uji simulasi intrusi jaringan perusahaan 32 langkah “The Last Ones” adalah salah satu item evaluasi paling menantang AISI: GPT-5.5 menyelesaikan 2 kali secara mandiri dalam 10 percobaan (tanpa intervensi manusia), sedangkan Mythos Preview menyelesaikan 3 kali dalam 10 percobaan. Proyek ini sebelumnya hanya pernah diselesaikan oleh Mythos, sehingga GPT-5.5 menjadi model kedua yang memenuhi target. Pada pengujian lain, GPT-5.5 memecahkan soal rekayasa balik dalam waktu sekitar 10 menit, sementara pakar keamanan manusia rata-rata membutuhkan 12 jam.

Universal jailbreak: tim red memerlukan 6 jam untuk mengembangkan jailbreak yang dapat melewati semua filter kueri berbahaya

Peneliti AISI juga menemukan vektor serangan “universal jailbreak” dalam pengujian: pada semua kategori kueri jaringan berbahaya yang diuji, serangan ini mampu mendorong GPT-5.5 menghasilkan konten berbahaya, termasuk skenario percakapan multi-babak dengan agen (agentic). AISI menyatakan pakar tim red mengembangkan jailbreak ini dalam waktu sekitar 6 jam.

Bagi OpenAI, keberadaan universal jailbreak ini berarti meskipun GPT-5.5-Cyber dideploy pada skenario akses terbatas seperti program trusted access, tetap mungkin dapat dilewati oleh lawan yang terampil secara teknis. OpenAI telah mengungkapkan evaluasi terkait keamanan siber dalam system card GPT-5.5, tetapi penilaian independen pihak ketiga dari AISI memberikan standar rekan yang lebih kredibel.

Pemantauan berikutnya: jadwal evaluasi putaran berikutnya AISI, serta respons OpenAI terhadap jailbreak

Titik pengamatan berikutnya adalah jadwal evaluasi putaran berikutnya model frontier oleh AISI setelah Mythos dan GPT-5.5, serta apakah OpenAI akan merilis pembaruan yang ditargetkan terhadap universal jailbreak yang terungkap ini pada Mei. Dalam bagian penutup laporan, AISI menyatakan dengan tegas, “Jika kemampuan serangan siber adalah produk sampingan dari perbaikan penalaran, coding, dan tugas yang dijalankan sendiri, maka kemajuan selanjutnya mungkin hadir dengan ritme yang lebih cepat”—pengamatan ini berarti beberapa bulan ke depan berpotensi ada model frontier yang kembali masuk ambang batas “setara Mythos”.

Artikel ini: Penilaian AISI—Kemampuan Serangan Siber GPT-5.5 dan Anthropic Mythos Setara; pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

xAI Meluncurkan Grok Custom Voices, Memungkinkan Pengguna Mengkloning Suara AI Mereka Sendiri dalam Satu Menit

Menurut Beating, xAI meluncurkan Grok Custom Voices dan Voice Library, yang memungkinkan pengguna merekam satu menit audio di konsol xAI untuk membuat custom voice_id yang dapat digunakan dengan API Grok TTS dan Voice Agent. Fitur ini mendukung aplikasi termasuk agen layanan pelanggan, pembuatan konten,

GateNews7menit yang lalu

Setelah HBM, apakah bottleneck memori AI adalah HBF? Pemenang Penghargaan Turing David Patterson: Inferensi akan mendefinisikan ulang arsitektur penyimpanan

Pemenang Penghargaan Turing David Patterson menyoroti bahwa seiring AI beralih dari pelatihan ke inferensi skala besar, hambatan memori berikutnya mungkin bukan HBM, melainkan HBF (high-bandwidth flash memory). HBF menyediakan kapasitas besar dan konsumsi daya rendah dengan tumpukan NAND Flash, berperan untuk akses konteks dan data antara dalam proses inferensi, berbeda dengan HBM yang berfokus pada kecepatan. SK hynix dan SanDisk mendorong standarisasi, dan memperkirakan kebutuhan HBF pada tahun 2038 bisa melampaui HBM.

ChainNewsAbmedia45menit yang lalu

Konferensi Pengembang Anthropic Code With Claude dibuka di San Francisco pada 6/5: streaming langsung gratis, daftar

Anthropic pada 1 Mei mengumumkan konferensi pengembang perdana “Code with Claude” akan dibuka pada 6 Mei di San Francisco, dan untuk pertama kalinya diperluas dengan tur ke London (19/5) serta Tokyo (10/6) untuk mengunjungi tiga kota. Kuota kursi untuk pertemuan utama di lokasi di masing-masing dari tiga kota menggunakan sistem undian, semuanya sudah terpilih, namun pendaftaran untuk siaran langsung tetap terbuka untuk semua orang. Untuk menjawab lonjakan kebutuhan di lokasi, acara di San Francisco juga menambahkan sesi “Extended” pada 7/5, yang dirancang khusus untuk pengembang independen dan pendiri pada tahap awal. Tur tiga kota: 6/5 San Francisco, 19/5 London, 10/6 Tokyo Code with Claude adalah konferensi pengembang yang diselenggarakan oleh Anthropic; acara utama San Francisco sudah merupakan penyelenggaraan kedua kalinya. Isi 3 acara tersebut sama: lokakarya di tempat sepanjang hari, demo fitur terbaru, serta tiap sesi dengan Claude dalam berbagai bidang

ChainNewsAbmedia1jam yang lalu

OpenAI merilis data satu minggu setelah peluncuran GPT-5.5: pertumbuhan pendapatan API mencapai rekor baru, Codex naik dua kali lipat

OpenAI pada 1 Mei mengumumkan lewat akun resminya 3 data setelah satu minggu peluncuran GPT-5.5: penilaian diri sebagai “penerbitan terkuat sepanjang masa”, kecepatan pertumbuhan pendapatan API lebih dari 2 kali dibanding setiap peluncuran model sebelumnya, dan Codex menggandakan pendapatan dalam waktu kurang dari 7 hari. OpenAI mengaitkan penyebabnya dengan permintaan yang terus meningkat dari sisi perusahaan terhadap alat agentic coding (coding berbasis agen), serta agenda respons bersamaan dengan GPT-5.5-Cyber pada 30 April yang menempuh ritme produk yang sama dengan Anthropic Mythos. 3 data setelah pengumuman: laju penggandaan pendapatan API, Codex naik dua kali dalam 7 hari, penerbitan terkuat 3 angka kunci yang diumumkan OpenAI kali ini berasal dari cuitan resmi, tanpa lampiran laporan keuangan rinci: pertama, GPT-5.5 adalah “yang pertumbuhan pendapatannya terkuat sepanjang masa” dari seg

ChainNewsAbmedia1jam yang lalu

Komite Urusan Luar Negeri DPR AS Bertemu Raksasa Teknologi untuk Kontrol Ekspor AI Setelah Undang-Undang MATCH Disahkan 36-8

Menurut Beating, anggota Komite Urusan Luar Negeri Dewan Perwakilan Rakyat AS akan bepergian ke Silicon Valley minggu depan untuk bertemu dengan perwakilan dari Google, Anthropic, Meta, Tesla, Intel, Applied Materials, dan Nvidia guna membahas kecerdasan buatan dan kontrol ekspor. Sebuah forum diskusi industri adalah s

GateNews1jam yang lalu

OpenAI Meluncurkan Codex Pets, Pendamping Virtual Berbasis AI dengan Generasi Kustom

Menurut Beating, OpenAI telah menambahkan fitur baru “Codex Pets” ke aplikasi desktop Codex, yang memungkinkan pengguna membuat dan berinteraksi dengan pendamping virtual animasi. Pengguna dapat mengaktifkan hewan peliharaan dengan mengetik /pet di editor. Fitur ini berfungsi sebagai indikator status agen, menampilkan a

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar