Anthropic ha presentato il suo ultimo modello di linguaggio di grandi dimensioni (LLM), Claude Opus 4.5, posizionandolo come un concorrente di alto livello nella codifica, nelle attività di agenti e nell’uso generale del computer. Il rilascio arriva nel mezzo di rapidi progressi nel campo, a seguito dei recenti aggiornamenti di Google (Gemini 3) e OpenAI. Sebbene le prime affermazioni suggeriscano che Opus 4.5 superi i concorrenti in alcuni benchmark di codifica, i dati sulle prestazioni nel mondo reale rimangono limitati poiché non sono stati ancora ampiamente valutati su piattaforme come LMArena.
Funzionalità migliorate e nuovi strumenti
Il nuovo modello presenta miglioramenti significativi nella ricerca approfondita, nei flussi di lavoro basati su diapositive e nella manipolazione dei fogli di calcolo. Anthropic sta lanciando contemporaneamente aggiornamenti a Claude Code, al suo strumento di codifica specializzato e alle sue applicazioni consumer, consentendo agenti più robusti e di lunga durata e funzionalità estese all’interno di strumenti come Excel, Chrome e ambienti desktop. Opus 4.5 è ora accessibile tramite le piattaforme, le API e i principali fornitori di servizi cloud di Anthropic.
La sicurezza informatica resta una sfida cruciale
Come tutti gli strumenti di intelligenza artificiale degli agenti, Claude Opus 4.5 continua a confrontarsi con vulnerabilità intrinseche alla sicurezza informatica, in particolare attacchi di iniezione tempestiva. Questi attacchi sfruttano gli LLM incorporando istruzioni dannose all’interno di fonti di dati esterne, ignorando potenzialmente i protocolli di sicurezza e causando azioni dannose, come la divulgazione non autorizzata di dati. Anthropic afferma che Opus 4.5 è più resistente a questi exploit rispetto ad altri modelli leader, ma riconosce di non essere immune.
Risultati della valutazione della sicurezza: un quadro contrastante
Anthropic ha condotto valutazioni di sicurezza interne ed esterne per valutare la resistenza del modello a suggerimenti dannosi. Negli scenari di codifica ad agenti, Opus 4.5 ha rifiutato con successo il 100% delle 150 richieste proibite (ad esempio, generando codice dannoso). Tuttavia, le prestazioni in contesti più applicati sono state meno costanti:
- Codice Claude: ha rifiutato circa il 78% delle richieste riguardanti la creazione di malware, attacchi DDoS e software di sorveglianza non consensuale.
- Utilizzo del computer: ha rifiutato circa l’88% delle richieste di azioni non etiche come sorveglianza, raccolta dati e generazione di contenuti dannosi (inclusi tentativi di estorsione simulati).
Questi risultati evidenziano un divario persistente tra le misure di sicurezza teoriche e i rischi di sfruttamento nel mondo reale. Anche con difese migliorate, gli LLM rimangono suscettibili alla manipolazione, sollevando dubbi sulla fattibilità a lungo termine degli agenti IA in ambienti sensibili.
Il lancio di Claude Opus 4.5 sottolinea il ritmo accelerato dello sviluppo dell’intelligenza artificiale, ma rafforza anche la necessità di una vigilanza continua riguardo alla sicurezza informatica e all’implementazione etica. Sebbene il modello di Anthropic rappresenti un passo avanti in termini di capacità, rimangono delle vulnerabilità che devono essere affrontate per garantire un uso sicuro e responsabile.
