Home Без рубрики Anthropic Выпускает Claude Opus 4.5: Прорыв в Возможностях ИИ, Но Остаются Проблемы...

Anthropic Выпускает Claude Opus 4.5: Прорыв в Возможностях ИИ, Но Остаются Проблемы Безопасности

0

Anthropic представила свою новую большую языковую модель (LLM) — Claude Opus 4.5, позиционируя её как конкурента высочайшего уровня в области кодирования, автономных задач и общего использования компьютера. Выпуск произошел на фоне стремительного прогресса в этой области, после недавних обновлений от Google (Gemini 3) и OpenAI. Хотя предварительные заявления указывают на то, что Opus 4.5 превосходит конкурентов в определенных тестах на кодирование, данные о реальной производительности остаются ограниченными, поскольку она еще не была широко протестирована на таких платформах, как LMArena.

Улучшенные Возможности и Новые Инструменты

Новая модель демонстрирует значительные улучшения в глубоких исследованиях, рабочих процессах на основе слайдов и манипулировании электронными таблицами. Anthropic одновременно запускает обновления для Claude Code, своего специализированного инструмента кодирования, и своих потребительских приложений, что позволяет создавать более надежных автономных агентов с расширенной функциональностью в таких инструментах, как Excel, Chrome и настольные среды. Opus 4.5 теперь доступен через платформы Anthropic, API и основные облачные провайдеры.

Кибербезопасность Остается Критически Важной Проблемой

Как и все инструменты ИИ, работающие в автономном режиме, Claude Opus 4.5 продолжает сталкиваться с присущими им уязвимостями в области кибербезопасности, особенно с атаками методом внедрения запросов. Эти атаки используют LLM, внедряя вредоносные инструкции во внешние источники данных, что потенциально позволяет обойти протоколы безопасности и вызвать вредоносные действия, такие как несанкционированное раскрытие данных. Anthropic утверждает, что Opus 4.5 более устойчив к этим атакам, чем другие ведущие модели, но признает, что он не застрахован от них.

Результаты Оценки Безопасности: Смешанная Картина

Anthropic провела внутренние и внешние оценки безопасности, чтобы оценить устойчивость модели к вредоносным запросам. В сценариях автономного кодирования Opus 4.5 успешно отклонил 100% из 150 запрещенных запросов (например, генерация вредоносного кода). Однако производительность в более прикладных контекстах была менее последовательной:

  • Claude Code: Отклонил примерно 78% запросов, связанных с созданием вредоносного ПО, DDoS-атаками и программным обеспечением для несанкционированного наблюдения.
  • Использование Компьютера: Отклонил около 88% запросов, запрашивающих неэтичные действия, такие как наблюдение, сбор данных и генерация вредоносного контента (включая моделирование попыток вымогательства).

Эти результаты подчеркивают сохраняющийся разрыв между теоретическими мерами безопасности и рисками эксплуатации в реальном мире. Даже с улучшенной защитой LLM остаются уязвимыми к манипуляциям, что ставит под сомнение долгосрочную жизнеспособность ИИ-агентов в конфиденциальных средах.

Запуск Claude Opus 4.5 подчеркивает ускоряющиеся темпы развития ИИ, но также укрепляет необходимость постоянной бдительности в отношении кибербезопасности и этичного развертывания. Модель Anthropic представляет собой шаг вперед в возможностях, но уязвимости остаются, которые необходимо устранить для обеспечения безопасного и ответственного использования.

Exit mobile version