Anthropic wypuszcza Claude Opus 4.5: Przełom w możliwościach sztucznej inteligencji, ale obawy dotyczące bezpieczeństwa pozostają

0
9

Firma Anthropic zaprezentowała swój nowy model dużego języka (LLM) – Claude Opus 4.5, pozycjonując ją jako czołowego konkurenta w obszarach kodowania, zadań offline i ogólnego użytkowania komputera. Wydanie następuje w związku z szybkim postępem w tej dziedzinie, po ostatnich aktualizacjach Google (Gemini 3) i OpenAI. Chociaż wczesne twierdzenia wskazują, że Opus 4.5 przewyższa konkurencję w niektórych testach kodowania, rzeczywiste dane dotyczące wydajności pozostają ograniczone, ponieważ nie zostały jeszcze szeroko przetestowane na platformach takich jak LMArena.

Ulepszone funkcje i nowe narzędzia

Nowy model wykazuje znaczną poprawę w zakresie dogłębnych badań, przepływów pracy opartych na slajdach i manipulacji arkuszami kalkulacyjnymi. Anthropic jednocześnie wprowadza aktualizacje Claude Code, swojego dedykowanego narzędzia do kodowania, i aplikacji konsumenckich, umożliwiając tworzenie solidniejszych agentów autonomicznych z ulepszoną funkcjonalnością w narzędziach takich jak Excel, Chrome i środowiskach stacjonarnych. Opus 4.5 jest teraz dostępny za pośrednictwem platform Anthropic, interfejsów API i głównych dostawców usług w chmurze.

Cyberbezpieczeństwo pozostaje kluczową kwestią

Podobnie jak wszystkie narzędzia AI działające w trybie offline, Claude Opus 4.5 nadal boryka się z nieodłącznymi lukami w zabezpieczeniach cyberbezpieczeństwa, zwłaszcza atakami polegającymi na wstrzykiwaniu zapytań. Ataki te wykorzystują LLM poprzez wstrzykiwanie złośliwych instrukcji do zewnętrznych źródeł danych, potencjalnie omijając protokoły bezpieczeństwa i powodując złośliwe działania, takie jak nieautoryzowane ujawnienie danych. Anthropic twierdzi, że Opus 4.5 jest bardziej odporny na te ataki niż inne czołowe modele, choć przyznaje, że nie jest na nie odporny.

Wyniki oceny bezpieczeństwa: mieszany obraz

Firma Anthropic przeprowadziła wewnętrzne i zewnętrzne oceny bezpieczeństwa, aby ocenić odporność modelu na złośliwe żądania. W scenariuszach kodowania offline Opus 4.5 pomyślnie odrzucił 100% ze 150 zabronionych żądań (np. wygenerowania złośliwego kodu). Jednak wydajność w większej liczbie kontekstów aplikacji była mniej spójna:

  • Kod Claude: Odrzucono około 78% żądań związanych ze złośliwym oprogramowaniem, atakami DDoS i oprogramowaniem monitorującym.
  • Wykorzystanie komputera: Odrzucono około 88% żądań żądających nieetycznych działań, takich jak inwigilacja, zbieranie danych i generowanie złośliwych treści (w tym symulacja prób wymuszenia).

Wyniki te podkreślają utrzymującą się lukę pomiędzy teoretycznymi środkami kontroli bezpieczeństwa a rzeczywistymi zagrożeniami operacyjnymi. Nawet przy zwiększonym bezpieczeństwie LLM pozostają podatne na manipulacje, co stawia pod znakiem zapytania długoterminową rentowność agentów AI we wrażliwych środowiskach.

Premiera Claude Opus 4.5 podkreśla rosnące tempo rozwoju sztucznej inteligencji, ale także podkreśla potrzebę zachowania ciągłej czujności w zakresie cyberbezpieczeństwa i etycznego wdrażania. Model Anthropic stanowi krok naprzód w zakresie możliwości, ale nadal występują luki w zabezpieczeniach, którymi należy się zająć, aby zapewnić bezpieczne i odpowiedzialne użytkowanie.

Previous articlePrzemysł sztucznej inteligencji staje w obliczu superpolitycznej kontrkampanii. Działania w obliczu obaw regulacyjnych
Next articleModel biznesowy Nvidii jest podobny do modelu Enron, ale pozostaje legalny