Anthropic heeft zijn nieuwste grote taalmodel (LLM), Claude Opus 4.5, onthuld en positioneert het als een topconcurrent op het gebied van coderen, agentische taken en algemeen computergebruik. De release komt te midden van snelle ontwikkelingen op dit gebied, na recente updates van Google (Gemini 3) en OpenAI. Hoewel vroege claims suggereren dat Opus 4.5 de concurrentie overtreft in bepaalde codeerbenchmarks, blijven de prestatiegegevens uit de echte wereld beperkt omdat deze nog niet uitgebreid zijn geëvalueerd op platforms als LMArena.
Verbeterde mogelijkheden en nieuwe tools
Het nieuwe model laat aanzienlijke verbeteringen zien op het gebied van diepgaand onderzoek, op dia’s gebaseerde workflows en spreadsheetmanipulatie. Anthropic lanceert tegelijkertijd updates voor Claude Code, zijn gespecialiseerde codeertool, en zijn consumentenapplicaties, waardoor robuustere, langlopende agents en uitgebreide functionaliteit binnen tools als Excel, Chrome en desktopomgevingen mogelijk worden. Opus 4.5 is nu toegankelijk via de platforms, API’s en grote cloudproviders van Anthropic.
Cyberbeveiliging blijft een cruciale uitdaging
Zoals alle agentische AI-tools blijft Claude Opus 4.5 worstelen met inherente kwetsbaarheden op het gebied van cyberbeveiliging, met name snelle injectie-aanvallen. Deze aanvallen maken misbruik van LLM’s door kwaadaardige instructies in te sluiten in externe gegevensbronnen, waardoor mogelijk veiligheidsprotocollen worden overschreven en schadelijke acties worden veroorzaakt, zoals ongeoorloofde openbaarmaking van gegevens. Anthropic beweert dat Opus 4.5 beter bestand is tegen deze exploits dan andere toonaangevende modellen, maar erkent dat het niet immuun is.
Resultaten veiligheidsevaluatie: een gemengd beeld
Anthropic voerde interne en externe veiligheidsevaluaties uit om de weerstand van het model tegen kwaadaardige aanwijzingen te beoordelen. In agentische coderingsscenario’s weigerde Opus 4.5 met succes 100% van de 150 verboden verzoeken (bijvoorbeeld het genereren van schadelijke code). De prestaties in meer toegepaste contexten waren echter minder consistent:
- Claude Code: Weigerde ongeveer 78% van de vragen over het maken van malware, DDoS-aanvallen en bewakingssoftware zonder wederzijds goedvinden.
- Computergebruik: Weigerde grofweg 88% van de verzoeken om onethische acties zoals surveillance, gegevensverzameling en het genereren van schadelijke inhoud (inclusief gesimuleerde afpersingspogingen).
Deze resultaten benadrukken een aanhoudende kloof tussen theoretische veiligheidsmaatregelen en reële uitbuitingsrisico’s. Zelfs met verbeterde verdedigingsmechanismen blijven LLM’s vatbaar voor manipulatie, wat vragen oproept over de levensvatbaarheid van AI-agenten op de lange termijn in gevoelige omgevingen.
De lancering van Claude Opus 4.5 onderstreept het steeds snellere tempo van de ontwikkeling van AI, maar versterkt ook de noodzaak van voortdurende waakzaamheid met betrekking tot cyberbeveiliging en ethische inzet. Hoewel het model van Anthropic een stap voorwaarts betekent op het gebied van capaciteiten, blijven er kwetsbaarheden bestaan die moeten worden aangepakt om veilig en verantwoord gebruik te garanderen.





















































