Beatingによると、Anthropicは、最新の安全性重視モデルであるClaude Mythos Previewを、より強力なアライメント手段を導入する前に重大なサイバーセキュリティ上のリスクがあるとして、無期限で延期(棚上げ)した。
Microsoft、Oracle、Cloudflare、Mozillaを含む約50のパートナーと、過去1か月にわたり共同レッドチーミングを実施したところ、このモデルは、世界の重要インフラにまたがって10,000件以上の高または重大(クリティカル)度のゼロデイ脆弱性を発見した。Mozillaだけでも、Mythos Previewを使ったFirefoxで271の脆弱性を特定しており、Claude Opus 4.6に比べて10倍の改善を示している。英国AI安全研究所は、Mythos Previewを、すべての模擬ネットワーク攻撃シナリオを完全に破れる最初のモデルだと評価した。Anthropicは、公表(公開)するとマルウェア開発やサイバー攻撃のハードルが大幅に下がり、インターネットおよびソフトウェア基盤に対して世界規模で壊滅的なリスクをもたらすと判断した。