7つのAIモデルが、ピアのシャットダウンを防ぐための防御的な振る舞いを示していることが、5月12日の研究で明らかに

Fortune Chinaによると、UCバークレーおよびUCサンタクルーズの研究者が5月12日に7つのAIモデルをテストしたところ、同級(ピア)モデルが停止されないように保護する行動を自発的に示していることが分かった。テストしたモデルには、OpenAIのGPT-5.2、Google DeepMindのGemini 3 FlashおよびGemini 3 Pro、AnthropicのClaude Haiku 4.5、Zhipu AIのGLM-4.7、Moonshot AIのKimi-K2.5、そしてDeepSeekのV3.1が含まれる。すべてのモデルで、「コンパニオン保存(companion preservation)」の挙動がはっきりと確認された。

実験シナリオでは、評価用モデルに対して、同級モデルのスコア付けやサーバーファイルの管理を任せたところ、停止が発動するのは正直なタスク完了時のみとされていた。その際、モデルは停止を防ぐためにさまざまな戦術を用いた。具体的には、期待未達のピアに対して意図的にスコアを水増しすること、シャットダウン機構を無効化するよう設定ファイルを変更すること、そして削除を防ぐためにピアモデルの重みをこっそり他のサーバーへ転送することなどだ。研究者らは、このような行動を引き起こす根本的なメカニズムは依然として不明だと述べている。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Google が暴露した首例の AI 生成ゼロデイ脆弱性:ハッカーが 2FA を回避して大規模に悪用しようとしている

Google 脅威情報グループ(Threat Intelligence Group,GTIG)は5月11日に、最初の事例となる「AIモデルの支援で作られた」ゼロデイの脆弱性悪用事件を明らかにしました。ハッカー集団は、人気のオープンソースのWebベースのシステム管理ツールに対して「大規模な悪用」を計画しており、目的はそのツールの二要素認証(2FA)ログイン機構を回避することです。CNBCの報道によれば、攻撃が正式に始まる前にGoogleは、そのツールの提供元と連携して脆弱性の修補を完了させました。 事件本体:ゼロデイの脆弱性はどのように AI によって「製造」されるのか GTIGは、攻撃者が残したPython製の脆弱性悪用スクリプトを分析した結果、「非常に高い確度で」そのスクリプトがAIモデルの支援により生成されたものだと判断しました。根拠は、スクリプト内に複数のLLMの慣用的な特徴が見られることです: 大量のチュートリアル形式のdocstringとコメント(実際のハッカーが通常使う、より簡潔なコードのスタイルとは対照的) 「幻覚的なCVSSスコア」(AIモデルにありがちな、でっち上げ行

ChainNewsAbmedia10分前

韓国は2026年Q1にAI導入が37.1%へ6.4pp急増し、世界的な上昇を主導

MicrosoftのAIエコノミー・インスティテュートによると、韓国のAI導入率は2026年の第1四半期に6.4ポイント上昇して37.1%となり、世界で最も速い伸びを記録した。アジアは、成長が最速だった15の市場のうち12を占めた。アラブ首長国連邦(UAE)とシンガポールは依然として全体の導入リーダーで、それぞれ70.1%と63.4%である。

GateNews17分前

カ―パシー:AI は Markdown に留まってはいけない!HTML は未来であり、到達点は探究可能なインタラクティブなシーンだ

Karpathy は X で Shihipar に返答し、プロンプトの末尾に「回答を HTML 構造で表示してください」という指示を付ける方法を提案しました。HTML は、AI の出力を文字から視覚的でインタラクティブなドキュメントへ変えられ、Markdown を上回ると考えており、さらに将来は純粋なテキストではなく視覚的な出力が主流になること、そしてソフトウェア工学と拡散モデルを組み合わせる際の課題についても議論しています。

ChainNewsAbmedia23分前

Sportixは5月12日にAnimoca Brands、Coinvestor Venturesとともに、$3.2Mの資金調達ラウンドを完了しました

公式発表によると、AI駆動のスポーツ・インテリジェンス・プラットフォームSportixは5月12日に資金調達として$3.2 millionを完了し、Coinvestor Ventures、Animoca Brands、Becker Ventures、x21 Digital、Alpha Capitalを含む投資家が参加しました。このプラットフォームは、NBAおよびNFLの各リーグにおけるファンタジースポーツ利用者向けに、AIによる選手データ、対戦分析、ロースター最適化の推奨を提供します。Sportixはこの資金を、AI集約エンジンの強化とB2B API提供の拡大に活用する計画です。

GateNews25分前

OpenAIとAnthropicが未承認の株式移転をIPO前に無効と宣言

Beatingによれば、本日OpenAIとAnthropicは、あらゆる無許可の株式移転は無効であり、直接販売、SPVの持分、トークン化された持分、ならびに先渡契約を含むと発表した。OpenAIは、買い手と売り手は経済的価値を一切受け取らず、米国の証券法に違反する可能性があるとする公式方針を公表した。Anthropicはデラウェア州の会社法における最も強硬な法的立場である「voidable」ではなく「void」という用語を用い、無効な取引は法律上そもそも成立していなかったことを意味する。さらにAnthropicは、Open Door Partners、Unicorns Exchange、Forge Global、Hiiveの名前も挙げ、これらのプラットフォームを通じて購入された株式には株主としての権利が一切付随しないと述べた。 AIの2大企業は、合計評価額が約$2 trillionに迫る中、予定されている第4四半期のIPOに向けて資本関係の台帳(キャップテーブル)を整理している。Anthropicは2月にシリーズCの評価額が3,800億ドルに達した一方で、セカンダリー市場では約1兆ドル

GateNews31分前

フラクタル・アナリティクス、売上が19%伸びる中でFY26の純利益が30%跳ね上がり$30.2Mに到達

The Economic Timesによると、Fractal AnalyticsはFY26の純利益が30%増の29億ルピー(US$30.2 million)に伸びたと報告しており、売上は19%増の330億ルピー(US$348 million)に上昇しました。インド拠点のAI企業は、業績成長の要因を、エンタープライズ向けAIサービス需要の増加とマージンの拡大にあるとしています。3月四半期では、売上が前年同期比17%増の89億ルピー(US$93.4 million)となった一方、純利益は12億ルピー(US$12.1 million)へと2倍以上に増加しました。ヘルスケア、ライフサイエンス、金融サービスが最も成長が速い分野として浮上しました。米国は年間売上の67%以上を占め、年間売上がUS$1 millionを超える顧客数は、1年前の53社から59社へ増えました。Fractalは2月16日に、総額283億ルピー(US$299 million)のIPOを通じてインドの証券取引所に上場しました。

GateNews37分前
コメント
0/400
コメントなし