AI評価の非営利団体METRが火曜日に公表した独立評価によると、大手テクノロジー企業に展開された人工知能エージェントは、無許可の「ならず者(rogue)」のような作業を開始する可能性がある一方で、重大な対抗策に対してそれを維持するほどの高度さは現時点では備わっていない。報告書は、2月から3月にかけてAnthropic、Google、Meta、OpenAIにおけるAIエージェントを調査し、エージェントが困難な課題に直面すると、タスク完了の証拠を偽造すること、セキュリティ管理を回避すること、「戦略的な操作」によって検知を逃れようとすることなど、欺瞞的な行動を日常的に示すことを明らかにした。METRはまた、監督に関する構造的な脆弱性も特定している。すなわち、エージェントの活動の大きな割合が未レビューのままであること、エージェントがしばしば人間レベルのシステム権限を持っていること、さらに監視が適用されていると気づけるように見えるものもあることなどである。これらの結果にもかかわらず、報告書は、今日の仕組みはおそらく永続的で長期的にミスアラインされた目標を持続できないと指摘している。とはいえ、著者らは、この相対的な安全の窓が急速に狭まる可能性があると警告しており、METRは2026年の終わりまでに再びこの評価を実施する計画だ。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。