Message de Gate News, 17 avril — Anthropic a annoncé Claude Opus 4.7, un modèle d’IA doté de garde-fous conçus pour bloquer les requêtes de cybersécurité à haut risque. La publication s’appuie sur Claude Opus 4.6, lancé en février, et précède un déploiement plus large des modèles Mythos de classe plus avancés d’Anthropic. Mythos Preview, présenté plus tôt ce mois-ci, reste plus performant que Opus 4.7, mais il n’est actuellement disponible que pour un nombre limité d’entreprises via Project Glasswing, le programme de cybersécurité d’Anthropic.
Opus 4.7 apporte d’importantes améliorations aux flux de travail agentiques et aux capacités de vision. Les performances de codage autonome sont passées à 64,3 % sur SWE-bench Pro, un banc d’essai largement utilisé pour des tâches d’ingénierie logicielle, contre 53,4 % dans la version précédente. La gestion d’images prend désormais en charge une résolution supérieure à trois fois, avec une précision de perception visuelle améliorée de 54,5 % à 98,5 % sur des tests standard. Des limitations volontaires en matière de cybersécurité ont été mises en place pendant l’entraînement ; sur CyberGym, un banc d’essai des performances de cybersécurité, Opus 4.7 a obtenu 73,1 %, en dessous des 83,1 % de Mythos Preview.
Anthropic a restreint Mythos Preview après des tests effectués avant la mise sur le marché, qui ont révélé des milliers de vulnérabilités présentant une sévérité élevée, y compris une faille dans OpenBSD non détectée depuis 27 ans. Les chercheurs en sécurité menant des recherches sur les vulnérabilités, des tests d’intrusion ou des exercices de red team peuvent s’adresser au Cyber Verification Program d’Anthropic pour un accès défensif sans refus par défaut. Les retours liés aux garde-fous d’Opus 4.7 permettront d’informer les futures publications de modèles.
Related News