Anthropic lança Claude Opus 4.5: um salto nas capacidades de IA, com preocupações persistentes de segurança

0
6

A Anthropic revelou seu mais recente modelo de linguagem grande (LLM), Claude Opus 4.5, posicionando-o como um concorrente de primeira linha em codificação, tarefas de agente e uso geral de computadores. O lançamento ocorre em meio a rápidos avanços na área, após atualizações recentes do Google (Gemini 3) e OpenAI. Embora as primeiras afirmações sugiram que o Opus 4.5 supera os concorrentes em certos benchmarks de codificação, os dados de desempenho do mundo real permanecem limitados, uma vez que ainda não foram extensivamente avaliados em plataformas como a LMArena.

Capacidades aprimoradas e novas ferramentas

O novo modelo apresenta melhorias significativas em pesquisa profunda, fluxos de trabalho baseados em slides e manipulação de planilhas. A Anthropic está lançando simultaneamente atualizações para Claude Code, sua ferramenta de codificação especializada e seus aplicativos de consumo, permitindo agentes mais robustos de longa duração e funcionalidade expandida em ferramentas como Excel, Chrome e ambientes de desktop. Opus 4.5 agora está acessível por meio das plataformas, APIs e principais provedores de nuvem da Anthropic.

A segurança cibernética continua sendo um desafio crítico

Como todas as ferramentas de IA de agência, o Claude Opus 4.5 continua a lidar com vulnerabilidades inerentes à segurança cibernética, especialmente ataques de injeção imediata. Esses ataques exploram LLMs incorporando instruções maliciosas em fontes de dados externas, potencialmente ignorando protocolos de segurança e causando ações prejudiciais, como divulgação não autorizada de dados. A Antthropic afirma que o Opus 4.5 é mais resistente a essas explorações do que outros modelos líderes, mas reconhece que não está imune.

Resultados da avaliação de segurança: um cenário misto

A Anthropic conduziu avaliações de segurança internas e externas para avaliar a resistência do modelo a solicitações maliciosas. Em cenários de codificação de agente, o Opus 4.5 recusou com sucesso 100% de 150 solicitações proibidas (por exemplo, gerando código prejudicial). No entanto, o desempenho em contextos mais aplicados foi menos consistente:

  • Código Claude: Recusou aproximadamente 78% das solicitações envolvendo criação de malware, ataques DDoS e software de vigilância não consensual.
  • Uso de computador: recusou cerca de 88% das solicitações solicitando ações antiéticas, como vigilância, coleta de dados e geração de conteúdo prejudicial (incluindo simulações de tentativas de extorsão).

Estes resultados destacam uma lacuna persistente entre as medidas de segurança teóricas e os riscos de exploração no mundo real. Mesmo com defesas melhoradas, os LLMs permanecem suscetíveis à manipulação, levantando questões sobre a viabilidade a longo prazo dos agentes de IA em ambientes sensíveis.

O lançamento do Claude Opus 4.5 sublinha o ritmo acelerado do desenvolvimento da IA, mas também reforça a necessidade de vigilância contínua em relação à segurança cibernética e à implantação ética. Embora o modelo da Antrópico represente um avanço em termos de capacidades, permanecem vulnerabilidades que devem ser abordadas para garantir um uso seguro e responsável.

Previous articleIndústria de IA enfrenta pressão contra-PAC em meio a temores regulatórios
Next articleO modelo de negócios da Nvidia traça paralelos com a Enron, mas permanece legal