Anthropic Merilis Claude Opus 4.5: Lompatan dalam Kemampuan AI, Dengan Masalah Keamanan yang Masih Ada

0
16

Anthropic telah meluncurkan model bahasa besar (LLM) terbarunya, Claude Opus 4.5, memposisikannya sebagai pesaing papan atas dalam pengkodean, tugas agen, dan penggunaan komputer secara umum. Rilis ini dilakukan di tengah kemajuan pesat di bidang ini, mengikuti pembaruan terkini dari Google (Gemini 3) dan OpenAI. Meskipun klaim awal menunjukkan bahwa Opus 4.5 mengungguli pesaing dalam tolok ukur pengkodean tertentu, data kinerja di dunia nyata masih terbatas karena belum dievaluasi secara ekstensif pada platform seperti LMArena.

Peningkatan Kemampuan & Alat Baru

Model baru ini menampilkan peningkatan signifikan dalam penelitian mendalam, alur kerja berbasis slide, dan manipulasi spreadsheet. Anthropic secara bersamaan meluncurkan pembaruan pada Claude Code, alat pengkodean khususnya, dan aplikasi konsumennya, memungkinkan agen jangka panjang yang lebih kuat dan fungsionalitas yang diperluas dalam alat seperti Excel, Chrome, dan lingkungan desktop. Opus 4.5 kini dapat diakses melalui platform Anthropic, API, dan penyedia cloud utama.

Keamanan Siber Masih Menjadi Tantangan Penting

Seperti semua alat AI agen, Claude Opus 4.5 terus bergulat dengan kerentanan keamanan siber yang melekat, khususnya serangan injeksi cepat. Serangan-serangan ini mengeksploitasi LLM dengan menyematkan instruksi berbahaya dalam sumber data eksternal, yang berpotensi mengabaikan protokol keselamatan dan menyebabkan tindakan berbahaya, seperti pengungkapan data tanpa izin. Anthropic menegaskan bahwa Opus 4.5 lebih tahan terhadap eksploitasi ini dibandingkan model terkemuka lainnya, namun mengakui bahwa Opus 4.5 juga tidak kebal.

Hasil Evaluasi Keamanan: Gambaran Campuran

Anthropic melakukan evaluasi keamanan internal dan eksternal untuk menilai ketahanan model terhadap permintaan jahat. Dalam skenario pengkodean agen, Opus 4.5 berhasil menolak 100% dari 150 permintaan terlarang (misalnya, menghasilkan kode berbahaya). Namun, kinerja dalam konteks yang lebih banyak diterapkan kurang konsisten:

  • Claude Code: Menolak sekitar 78% permintaan yang melibatkan pembuatan malware, serangan DDoS, dan perangkat lunak pengawasan non-konsensual.
  • Penggunaan Komputer: Menolak sekitar 88% permintaan tindakan tidak etis seperti pengawasan, pengumpulan data, dan pembuatan konten berbahaya (termasuk simulasi upaya pemerasan).

Hasil-hasil ini menyoroti kesenjangan yang terus-menerus antara langkah-langkah keselamatan teoritis dan risiko eksploitasi di dunia nyata. Bahkan dengan pertahanan yang lebih baik, LLM tetap rentan terhadap manipulasi, sehingga menimbulkan pertanyaan tentang kelangsungan jangka panjang agen AI di lingkungan sensitif.

Peluncuran Claude Opus 4.5 menggarisbawahi percepatan pengembangan AI, namun juga memperkuat perlunya kewaspadaan berkelanjutan terkait keamanan siber dan penerapan etis. Meskipun model Anthropic mewakili sebuah langkah maju dalam hal kemampuan, masih terdapat kerentanan yang harus diatasi untuk memastikan penggunaan yang aman dan bertanggung jawab.