トロント大学、Vector Institute、ケンブリッジ大学、そしてServiceNowの研究者は、攻撃戦略を生成でき、ネットワーク全体に自律的に拡散できるAI搭載ワームを実証した。この概念実証(PoC)のマルウェアは、クラウドサービスではなくオープンウェイトモデルを使って感染端末上で動作し、以前のAI主導型の脅威からの転換を示している。研究者らは、この研究はAIを用いたサイバー攻撃が机上の理論を越えたことを示しており、そのワームは脆弱性を特定し、個別化された攻撃経路を考案し、システムを侵害し、標的の違いに合わせて戦術を適応させながら自己複製も行えると主張する。
研究論文は、チームが「従来型ワームからの根本的な転換」だと位置づける内容を説明している。「私たちは、自律的な生成型の敵に備えなければならない」と研究者らは書いた。「固定されたエクスプロイトコードによって定義されるのではなく、標的について推論し、観測に適応し、リアルタイムで攻撃ロジックを合成する能力によって定義される、オペレーターなしで自己伝播するマルウェア・システムだ。」
コンピュータワームは、脆弱なネットワークに対して自動的に拡散する自己複製型マルウェアである。2000年のILOVEYOUや2017年のWannaCryを含む歴史的なワームの流行では、世界中の数百万台のコンピュータが感染し、重要なサービスが妨害され、損害は数十億ドルに及んだ。さらに最近では、Shai-Huludマルウェアが、自己伝播型の攻撃がオンライン上でどのように拡散しうるかを示し、OpenAIやMistralを含む大企業が使うソフトウェアに感染を広げた。
研究者、隔離したネットワーク環境でAIワームを試験
チームは、一般的な脆弱性を仕込んだ33のLinux、Windows、IoTシステムを含む隔離された仮想ネットワーク内でワームをテストした。15回の実験の中で、ワームは平均31.3件の脆弱性を特定し、23.1台のホストを正常に侵害し、自律運用の7日間のうちにおよそ20台へと拡散した。
一部のテストでは、マルウェアが自己複製の7世代目まで到達した。研究者らは、このシステムが、モデルの学習打ち切り以降に開示された脆弱性を、実行時に新たに公開されたセキュリティ勧告を取り込むことで悪用できることを見いだした。これにより、モデルの元の学習データには含まれていなかった情報を取り込めるようになった。
AIワームはクラウド基盤なしで動作する
この研究によれば、このAI搭載ワームが従来のバージョンと異なる点は、大規模言語モデルを用いて標的ごとに適応し、固定された一連のエクスプロイトに頼るのではなく、リアルタイムで脆弱性を特定して攻撃戦略を生成できることだという。
「WannaCryのような従来型のワームは、あらかじめ決まった脆弱性を悪用し、その拡散は、それらの脆弱性をパッチ適用することで止められうる」と研究者らは書いた。「ここでは、人工知能エージェントが、まったく新しい脅威を可能にすることを示す。遭遇した各標的に合わせて攻撃戦略を生成するワームだ。」
多くのAIアプリケーションと異なり、このワームはAIクラウドサービスへのアクセスに依存しなかった。AWS、Microsoft Azure、Google Cloudといったプロバイダのクラウド基盤に頼るのではなく、マルウェアは侵害された端末上でAIモデルを直接実行した。拡散するにつれて、感染したシステムは実質的にその計算基盤の一部となった。
悪用を防ぐため研究チームは技術的詳細を伏せる
テストは管理された環境で行われた一方、著者らは、この研究のデュアルユース(用途が転用されうる性質)であることを認め、悪用のリスクを減らすために一部の技術的詳細を意図的に公開しなかった。
「このプレプリントを公開するに先立ち、私たちは原稿を編集し、私たちの手法の提示が、この新たな脅威についてコミュニティが研究するのに必要な詳細度のバランスを保ちつつ、悪意ある行為者が私たちの手法を使ってマルウェアを作成するリスクを抑えるようにした」と研究者らは述べた。
研究者らによれば、このプロジェクトは適応型コンピュータワームがもたらすリスクをよりよく理解し、AIが可能にするサイバー能力がどこまで進んだのかを示す証拠を提供することを目的としている。「この脅威に対処するには、研究・セキュリティ・産業・政策の各コミュニティで連携した取り組みが必要となる。すなわち、ハーネス級の能力を試す評価フレームワーク、自律エージェントの行動的特徴に調整された検知システム、そしてオープンウェイト推論の分散的な性質を織り込む規制措置だ」と彼らは書いた。
FAQ
AIワームの研究で研究者は何を実証しましたか?
トロント大学、Vector Institute、ケンブリッジ大学、そしてServiceNowの研究者は、脆弱性を特定し、攻撃戦略を生成し、さまざまな標的に対して戦術を適応させながらネットワーク全体に自律的に拡散できる、AI搭載ワームの概念実証を示した。
AIワームは検証ではどのように機能しましたか?
33のシステムを含む隔離された仮想ネットワークで行われた15回の実験を通じて、ワームは平均31.3件の脆弱性を特定し、23.1台のホストを正常に侵害し、自律運用の7日間でおよそ20台にまで拡散した。いくつかのテストでは、マルウェアが自己複製の7世代目に到達した。
なぜ研究チームは技術的詳細を伏せたのですか?
著者らは、この研究のデュアルユースであることを認め、悪意ある行為者が彼らの手法を使ってマルウェアを作成するリスクを抑えつつ、新たな脅威についてコミュニティが研究するのに十分な深さも提供するために、いくつかの技術的詳細を意図的に伏せた。