Anthropic випускає Claude Opus 4.5: прорив у можливостях ШІ, але проблеми з безпекою залишаються

0
1

Anthropic представила свою нову велику мовну модель (LLM) – Claude Opus 4.5, позиціонуючи її як конкурента вищого рівня в області кодування, офлайн-завдань і загального використання комп’ютера. Випуск з’явився на тлі швидкого прогресу в цій галузі після останніх оновлень від Google (Gemini 3) і OpenAI. Хоча перші заявки вказують на те, що Opus 4.5 перевершує конкурентів у певних тестах кодування, реальні дані про продуктивність залишаються обмеженими, оскільки він ще не був широко протестований на таких платформах, як LMArena.

Покращені функції та нові інструменти

Нова модель демонструє значні покращення в глибоких дослідженнях, робочих процесах на основі слайдів і роботі з електронними таблицями. Anthropic одночасно запускає оновлення для Claude Code, свого спеціального інструменту кодування, і споживчих додатків, що дозволяє створювати більш надійні автономні агенти з розширеною функціональністю в таких інструментах, як Excel, Chrome і настільних середовищах. Opus 4.5 тепер доступний через платформи Anthropic, API та основних хмарних провайдерів.

Кібербезпека залишається критичною проблемою

Як і всі інструменти штучного інтелекту, які працюють в автономному режимі, Claude Opus 4.5 продовжує стикатися з властивими вразливостями кібербезпеки, особливо атаками ін’єкції запитів. Ці атаки використовують LLM, впроваджуючи зловмисні інструкції в зовнішні джерела даних, потенційно обходячи протоколи безпеки та спричиняючи зловмисні дії, наприклад неавторизоване розкриття даних. Anthropic стверджує, що Opus 4.5 більш стійкий до цих атак, ніж інші провідні моделі, але визнає, що він не захищений від них.

Результати оцінки безпеки: змішана картина

Anthropic провела внутрішню та зовнішню оцінку безпеки, щоб оцінити стійкість моделі проти зловмисних запитів. У сценаріях офлайн-кодування Opus 4.5 успішно відхилив 100% із 150 заборонених запитів (наприклад, створення шкідливого коду). Однак продуктивність у більшій кількості прикладних контекстів була менш стабільною:

  • Claude Code: відхилено приблизно 78% запитів, пов’язаних із шкідливим програмним забезпеченням, DDoS-атаками та програмним забезпеченням для стеження.
  • Використання комп’ютера: відхилено приблизно 88% запитів щодо неетичних дій, таких як стеження, збір даних і створення шкідливого вмісту (зокрема імітація спроб вимагання).

Ці результати підкреслюють розрив між теоретичними засобами контролю безпеки та реальними експлуатаційними ризиками. Навіть з покращеною безпекою LLM залишаються вразливими до маніпуляцій, що ставить під сумнів довгострокову життєздатність агентів ШІ в чутливих середовищах.

Запуск Claude Opus 4.5 підкреслює прискорення темпів розвитку штучного інтелекту, але також посилює необхідність постійної пильності щодо кібербезпеки та етичного розгортання. Модель Anthropic є кроком вперед у можливостях, але залишаються вразливі місця, які необхідно усунути, щоб забезпечити безпечне та відповідальне використання.

Previous articleІндустрія ШІ стикається з суперполітичною контркампанією. Дії в умовах регуляторних проблем