Gate Newsメッセージ、4月17日—Anthropicは、ハイリスクのサイバーセキュリティ要求をブロックするために設計されたセーフガードを備えたAIモデル、Claude Opus 4.7を発表しました。このリリースは、2月に導入されたClaude Opus 4.6に基づいており、Anthropicのより高度なMythosクラス・モデルの幅広い展開に先立ちます。今月初めに導入されたMythos PreviewはOpus 4.7よりも能力が高いままですが、Anthropicのサイバーセキュリティ・プログラムであるProject Glasswingを通じて、現在は限られた企業のみに提供されています。
Opus 4.7は、エージェント型ワークフローと視覚能力において大幅な改善をもたらします。SWE-bench Proでの自律的なコーディング性能は、ソフトウェアエンジニアリング作業で広く使われるベンチマークで、前バージョンの53.4%から64.3%へと上昇しました。画像処理は、3倍以上の解像度に対応するようになり、標準テストでの視覚精度は54.5%から98.5%へと向上しています。意図的なサイバーセキュリティ上の制限はトレーニング中に実装されました。サイバーセキュリティ性能ベンチマークであるCyberGymでは、Opus 4.7のスコアは73.1%で、Mythos Previewの83.1%を下回りました。
Anthropicは、事前のリリース前テストで数千件の高重大度の脆弱性が見つかったことを受けて、Mythos Previewを制限しました。これには、27年間検出されていなかったOpenBSDの欠陥も含まれます。脆弱性研究、ペネトレーションテスト、またはレッドチーム演習を行うセキュリティ研究者は、デフォルトの拒否なしで防御目的のアクセスを得るために、AnthropicのCyber Verification Programに申請できます。Opus 4.7のセーフガードからのフィードバックは、今後のモデルリリースに反映されます。