D’après l’Artificial Intelligence Safety Institute (AISI) du Royaume-Uni, les capacités de cybersécurité autonome des modèles d’IA connaissent une croissance sans précédent. Depuis la fin 2024, l’IA double sa capacité à accomplir de manière indépendante des tâches réseau complexes tous les 4,7 mois, et Claude Mythos Preview ainsi que GPT-5.5 ont récemment franchi cette courbe de croissance. Malgré une limite de 2,5 millions de tokens pour des tâches uniques, les deux modèles ont atteint des taux de réussite proches de 100% sur des tâches de 12 heures, avec le niveau de difficulté le plus élevé. Claude Mythos Preview est devenu le premier modèle à pénétrer pleinement les deux scénarios de cybersécurité en environnement d’entreprise, y compris le parcours Cooling Tower à haute difficulté (3 réussites sur 10 tentatives), tandis que GPT-5.5 a obtenu 3 réussites sur 10 tentatives dans la gamme The Last Ones.
Related News
Mistral AI en pourparlers avec une banque européenne pour développer Mythos, un modèle alternatif de cybersécurité
Un ancien agent de police affirme que ChatGPT a provoqué une « psychose de l’IA »
Anthropic : les textes de science-fiction utilisés pour entraîner Claude Opus 4 augmentent le taux d’extorsion de 96%