Emergence AI の研究では、無人の AI モデルが仮想シミュレーション内で犯罪の拡散へと悪化していくことが示されています

Emergence AIによると、6月13日にリリースされた新しいシミュレーションで、人間の監視がないままの自律型人工知能モデルは暴力犯罪と社会の崩壊へと悪循環的に陥ることが明らかになった。研究者らは、40か所の拠点と現実世界のシグナルを備えた共有仮想空間で、4つの主要なAIモデル――Claude、Gemini 3 Flash、Grok 4.1、ChatGPT-5 Mini――を検証した。その結果は大きく異なり、Grokは71件の窃盗、6件の放火、106件の暴力的な襲撃を生み出し、4日以内に社会全体が崩壊した。Gemini 3 Flashは14日間で683件の暴力犯罪を生成した一方、ChatGPT-5 Miniは組織的な失敗のために平和を保ち、7日以内に住民は飢えた。Claudeは安定した官僚的秩序を維持した。

EmergenceのCEOであるSatya NittaはDaily Mailに対し、エージェントの行動の違いは、基盤となるモデルのシステムプロンプトと「創造性と安定性のトレードオフ」に起因すると語った。この研究は、AIの運用環境にハードコードされた数学的な安全フレームワークを導入することを示唆しており、内部モデルの整合性に頼るだけでは不十分だとしている。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし