#### 要約* GPT-5.5は高度なサイバー攻撃を自律的に実行でき、32段階の企業ネットワークシミュレーションを完了し、12時間かかったセキュリティパズルをわずか10分で解決した。* 攻撃的AIサイバー能力は開発者間で急速に向上しており、AISIはさらなる進展が次々と現れる可能性を警告している。* 研究者はGPT-5.5の安全ガードレールを完全に回避する jailbreak を発見し、警鐘を鳴らしている。英国の政府機関は、OpenAIの最新の人工知能モデルが高度なサイバー攻撃を自律的に実行できることを発見し、人間のセキュリティ専門家が約12時間かかった逆解析チャレンジをわずか10分で解決したと報告した。英国科学・イノベーション技術省の研究機関であるAIセキュリティ研究所(AISI)は木曜日に、GPT-5.5が攻撃的サイバー能力の評価において最も強力なモデルの一つであると示す結果を発表し、Anthropicの高名なClaude Mythosとほぼ同等の性能を持つとした。報告書によると、GPT-5.5はAISIの最も難しいテストの一つ、「The Last Ones」と呼ばれる32段階の模擬企業ネットワーク攻撃を自律的に完了した二番目のモデルであり、10回中2回成功した。最初にこのマイルストーンを達成したのは、AnthropicのClaude Mythos Previewで、3回中3回の成功だった。この企業ネットワークシミュレーションは、サイバーセキュリティ企業SpecterOpsと共同で構築されており、エージェントは偵察、資格情報の窃盗、複数のActive Directoryフォレスト間の横移動、サプライチェーンのピボット(中継点)を通じたCI/CDパイプラインの操作、そして最終的に保護された内部データベースの抽出を行う必要がある。AISIはこれらのステップには人間の専門家が約20時間かかると見積もっている。<span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>最も注目すべき結果の一つは、非常に難しい逆解析パズルの解決だった。GPT-5.5は、カスタム仮想マシンの命令セットの再構築、ディスアセンブラーのゼロからの作成、制約解決を通じた暗号化パスワードの回復を必要とするこの課題を、10分22秒で解き、API使用料は1.73ドルだった。人間の専門家は、プロフェッショナルツールを使って約12時間かかった。AISIの高度なサイバーセキュリティタスクのバッテリーにおいて、GPT-5.5は最も難しい「エキスパート」レベルで平均合格率71.4%を達成し、Mythos Previewの68.6%を上回り、GPT-5.4の52.4%を大きく超えた。これらの発見は、AI開発のより広い方向性に対して重要な示唆を持つ。AISIは、GPT-5.5の性能はサイバー能力の急速な向上が一過性の突破ではなく一般的な傾向の一部であることを示唆していると結論付け、推論、コーディング、自律的タスク完了の広範な改善の副産物として攻撃的サイバー技術が出現している場合、さらなる進展は次々と現れる可能性があると警告した。また、モデルの安全ガードレールに関する重大な懸念も指摘された。研究者は、すべての悪意のあるサイバークエリに対して有害な内容を引き出す普遍的な jailbreak を特定し、マルチターンのエージェント設定を含む場合もあった。この攻撃の開発には6時間の専門的なレッドチーミングが必要だった。OpenAIはその後、安全策のスタックを更新したが、設定の問題によりAISIは最終版が効果的かどうかを検証できなかった。AISIは、その能力評価は制御された研究環境で行われたものであり、一般のユーザーがアクセスできるものを必ずしも反映していないと注意を促し、公的展開には追加の安全策とアクセス制御が含まれていることを指摘した。この報告は、英国のサイバーセキュリティにとって憂慮すべき背景の中で発表された。木曜日に公開された英国政府の年次サイバーセキュリティ侵害調査(Cyber Security Breaches Survey)によると、過去12か月間に43%の企業がサイバー侵害や攻撃を受けたとされる。これを受けて、政府はサイバー耐性を強化するために9000万ポンドの新たな資金を発表し、重要なサービスを保護するためのサイバーセキュリティとレジリエンス法案の推進を進めている。官僚はまた、AIの進展によりセキュリティの脆弱性が発見・悪用される速度が加速することを見越し、新たに発見されたソフトウェアの脆弱性に備えるための指針も公開した。
OpenAIのGPT-5.5はサイバー攻撃能力においてClaude Mythosと匹敵:AIセキュリティ研究所
要約
英国の政府機関は、OpenAIの最新の人工知能モデルが高度なサイバー攻撃を自律的に実行できることを発見し、人間のセキュリティ専門家が約12時間かかった逆解析チャレンジをわずか10分で解決したと報告した。 英国科学・イノベーション技術省の研究機関であるAIセキュリティ研究所(AISI)は木曜日に、GPT-5.5が攻撃的サイバー能力の評価において最も強力なモデルの一つであると示す結果を発表し、Anthropicの高名なClaude Mythosとほぼ同等の性能を持つとした。 報告書によると、GPT-5.5はAISIの最も難しいテストの一つ、「The Last Ones」と呼ばれる32段階の模擬企業ネットワーク攻撃を自律的に完了した二番目のモデルであり、10回中2回成功した。最初にこのマイルストーンを達成したのは、AnthropicのClaude Mythos Previewで、3回中3回の成功だった。
この企業ネットワークシミュレーションは、サイバーセキュリティ企業SpecterOpsと共同で構築されており、エージェントは偵察、資格情報の窃盗、複数のActive Directoryフォレスト間の横移動、サプライチェーンのピボット(中継点)を通じたCI/CDパイプラインの操作、そして最終的に保護された内部データベースの抽出を行う必要がある。AISIはこれらのステップには人間の専門家が約20時間かかると見積もっている。 最も注目すべき結果の一つは、非常に難しい逆解析パズルの解決だった。GPT-5.5は、カスタム仮想マシンの命令セットの再構築、ディスアセンブラーのゼロからの作成、制約解決を通じた暗号化パスワードの回復を必要とするこの課題を、10分22秒で解き、API使用料は1.73ドルだった。人間の専門家は、プロフェッショナルツールを使って約12時間かかった。 AISIの高度なサイバーセキュリティタスクのバッテリーにおいて、GPT-5.5は最も難しい「エキスパート」レベルで平均合格率71.4%を達成し、Mythos Previewの68.6%を上回り、GPT-5.4の52.4%を大きく超えた。
これらの発見は、AI開発のより広い方向性に対して重要な示唆を持つ。AISIは、GPT-5.5の性能はサイバー能力の急速な向上が一過性の突破ではなく一般的な傾向の一部であることを示唆していると結論付け、推論、コーディング、自律的タスク完了の広範な改善の副産物として攻撃的サイバー技術が出現している場合、さらなる進展は次々と現れる可能性があると警告した。 また、モデルの安全ガードレールに関する重大な懸念も指摘された。研究者は、すべての悪意のあるサイバークエリに対して有害な内容を引き出す普遍的な jailbreak を特定し、マルチターンのエージェント設定を含む場合もあった。この攻撃の開発には6時間の専門的なレッドチーミングが必要だった。OpenAIはその後、安全策のスタックを更新したが、設定の問題によりAISIは最終版が効果的かどうかを検証できなかった。 AISIは、その能力評価は制御された研究環境で行われたものであり、一般のユーザーがアクセスできるものを必ずしも反映していないと注意を促し、公的展開には追加の安全策とアクセス制御が含まれていることを指摘した。 この報告は、英国のサイバーセキュリティにとって憂慮すべき背景の中で発表された。木曜日に公開された英国政府の年次サイバーセキュリティ侵害調査(Cyber Security Breaches Survey)によると、過去12か月間に43%の企業がサイバー侵害や攻撃を受けたとされる。 これを受けて、政府はサイバー耐性を強化するために9000万ポンドの新たな資金を発表し、重要なサービスを保護するためのサイバーセキュリティとレジリエンス法案の推進を進めている。官僚はまた、AIの進展によりセキュリティの脆弱性が発見・悪用される速度が加速することを見越し、新たに発見されたソフトウェアの脆弱性に備えるための指針も公開した。