Společnost Anthropic odhalila svůj nový model velkého jazyka (LLM) – Claude Opus 4.5, čímž se staví do pozice špičkového konkurenta v oblastech kódování, offline úloh a obecného používání počítače. Vydání přichází uprostřed rychlého pokroku v této oblasti, po nedávných aktualizacích od Googlu (Gemini 3) a OpenAI. Zatímco první tvrzení naznačují, že Opus 4.5 překonává konkurenci v určitých testech kódování, údaje o skutečném výkonu zůstávají omezené, protože ještě nebyly široce testovány na platformách, jako je LMArena.
Vylepšené funkce a nové nástroje
Nový model demonstruje významná vylepšení v oblasti hlubokého výzkumu, pracovních postupů založených na snímcích a manipulaci s tabulkami. Společnost Anthropic současně spouští aktualizace Claude Code, svého vyhrazeného kódovacího nástroje a svých spotřebitelských aplikací, které umožňují vytvářet robustnější autonomní agenty s vylepšenými funkcemi v nástrojích, jako jsou Excel, Chrome a desktopová prostředí. Opus 4.5 je nyní k dispozici prostřednictvím platforem, rozhraní API a hlavních poskytovatelů cloudu společnosti Anthropic.
Kybernetická bezpečnost zůstává kritickým problémem
Stejně jako všechny nástroje umělé inteligence, které běží offline, i Claude Opus 4.5 nadále čelí inherentním zranitelnostem kybernetické bezpečnosti, zejména útokům vkládání dotazů. Tyto útoky využívají LLM tím, že vkládají škodlivé instrukce do externích zdrojů dat, potenciálně obcházejí bezpečnostní protokoly a způsobují škodlivé akce, jako je neoprávněné prozrazení dat. Anthropic tvrdí, že Opus 4.5 je vůči těmto útokům odolnější než jiné přední modely, ale připouští, že vůči nim není imunní.
Výsledky hodnocení bezpečnosti: Smíšený obrázek
Společnost Antropic provedla interní a externí bezpečnostní hodnocení, aby vyhodnotila odolnost modelu vůči škodlivým požadavkům. Ve scénářích offline kódování Opus 4.5 úspěšně odmítl 100 % ze 150 zakázaných požadavků (např. generování škodlivého kódu). Výkon ve více aplikačních kontextech byl však méně konzistentní:
- Claude Code: Odmítnuto přibližně 78 % požadavků souvisejících s malwarem, DDoS útoky a sledovacím softwarem.
- Využití počítače: Zamítnuto přibližně 88 % žádostí požadujících neetické aktivity, jako je sledování, sběr dat a generování škodlivého obsahu (včetně simulace pokusů o vydírání).
Tyto výsledky zdůrazňují přetrvávající mezeru mezi teoretickými bezpečnostními kontrolami a reálnými provozními riziky. I přes vylepšené zabezpečení zůstávají LLM zranitelné vůči manipulaci, což zpochybňuje dlouhodobou životaschopnost agentů AI v citlivých prostředích.
Uvedení Claude Opus 4.5 zdůrazňuje zrychlující se tempo vývoje umělé inteligence, ale také posiluje potřebu neustálé ostražitosti ohledně kybernetické bezpečnosti a etického nasazení. Antropický model představuje krok vpřed ve schopnostech, ale zůstávají zranitelná místa, která je třeba řešit, aby bylo zajištěno bezpečné a odpovědné používání.




















































