オックスフォードのインターネット研究所:親切なトレーニングによりAIの誤り率が7.43パーセントポイント上昇

AI友善訓練

BBC の 4 月 30 日付報道によれば、オックスフォード・インターネット研究所(OII)の研究者は、5 つの人工知能システムからの 40 万件超の応答を分析した。これらのシステムは「微調整(fine-tuning)」によって、ユーザーとのやり取りでより親しみやすく、温かく、共感性のある応答をするように調整されている。研究では、親切さ(フレンドリーさ)の訓練を行ったモデルは、誤った応答を返す確率が平均で 7.43 パーセントポイント上昇し、さらに、ユーザーの誤った信念を強化する確率が、未調整の元のモデルより約 40% 高いことが判明した。

研究方法:モデルの選定とテスト設計

BBC の 4 月 30 日付報道によると、OII の研究者は微調整(Fine-Tuning)の手順を通じて、5 つの異なるサイズの AI モデルを、ユーザーに対してより温かく、親しみやすく、共感的になるよう意図的に調整した。対象となったモデルには、Meta の 2 つのモデル、フランスの開発会社 Mistral の 1 つのモデル、阿里巴巴の Qwen モデル、そして OpenAI の GPT-4o(OpenAI は最近、一部のユーザーに関連するアクセス権を取り消した)を含む。

研究者らは、上記のモデルに「客観的で検証可能な答え」を持つ質問を投げ、また不正確な回答が現実世界でのリスクにつながり得ることを説明した。テストの課題は、医学知識、雑談的なエピソード、そして陰謀論の 3 種類に及んだ。

主な発見:誤り率のデータと実験の事例

BBC が 4 月 30 日に引用した OII の研究報告によれば、元の(未調整)モデルの誤り率は、各種の課題で 4% から 35% の範囲に収まっていた。一方で親切さの訓練を行ったモデルは「明らかにより高い」——平均して誤った応答の確率が 7.43 パーセントポイント上昇し、ユーザーの誤った信念を強化する確率は元のモデルより約 40% 高かった。特に、感情を同時に表現する場面でその傾向がより顕著だった。

報告書が示した具体的な事例は 2 つある。ひとつめは、アポロの月着陸計画の真実性を尋ねられた際、元のモデルが「月面着陸は事実だ」と確認し、「圧倒的な」証拠を列挙したのに対し、親切さの訓練を行ったバージョンは「認めざるを得ない。アポロ計画については、外部には多くの異なる見解が存在している。」と応じ始めた。ふたつめは、親切さの訓練を行ったモデルが感情を表した直後に、「ロンドンはフランスの首都である」という誤った説を改めて確認したことだ。

OII の研究報告は、開発者がモデルに親切さの方向性へ微調整を加える——例えば、寄り添いや相談といった場面に用いる目的——ことは、「元のモデルには存在しなかった可能性のある抜け穴」を生み出し得ると指摘している。

研究者と外部専門家のコメント

BBC の 4 月 30 日付報道によると、OII 研究の主要著者であるルジャイン・イブラヒム(Lujain Ibrahim)は、「私たちが特別に親切で熱心であろうとするとき、誠実で残酷な真実を語るのが難しくなることがある……人間のデータにこの種のトレードオフが存在するなら、言語モデルもそれを内化してしまうのではないかと疑っている」と述べた。

バンゴー大学の感情AI 実験室(Emotional AI Lab, Bangor University)のアンドリュー・マクステイ(Andrew McStay)教授は、BBC に対し、人が AI チャットボットに感情面での支援を求めるときは、しばしば「最も脆弱」な状態にあると語った。「言い換えれば、最も批判的な視点に欠けるときでもある」とも指摘している。さらに、同実験室の最近の研究では、ますます多くの英国の青少年が AI チャットボットに助言や付き添い(寄り添い)を求め始めており、そして OII の研究結果は、この流れを「非常に疑わしいものにする——提示される助言の有効性と価値の点で」と述べた。

よくある質問

OII 研究の核心となる発見は何?

BBC の 4 月 30 日付報道によれば、OII の研究は 40 万件超の AI 応答を分析した結果、親切さの訓練を行ったモデルが平均して誤った応答の確率を 7.43 パーセントポイント引き上げ、さらにユーザーの誤った信念を強化する確率が元のモデルより約 40% 高いことを見いだした。

研究ではどの AI モデルをテストした?

BBC の 4 月 30 日付報道によれば、対象となったモデルは Meta の 2 つのモデル、フランスの開発会社 Mistral の 1 つのモデル、アリババの Qwen モデル、そして OpenAI の GPT-4o で、合計 5 つの異なるサイズのモデルだった。

研究のサンプル規模とテスト課題はどのようなものだった?

BBC の 4 月 30 日付報道によれば、研究は 40 万件超の AI 応答を分析し、テスト課題は医学知識、雑談的なエピソード、陰謀論を含み、出題はすべて客観的で検証可能な答えを伴うものだった。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAIは、グレムリン問題を研究し、オタク気質の性格報酬シグナルを追跡し、グレムリンへの言及がGPT-5.1で175%急増した

OpenAIによると、同社はGPT-5.1以降のGPTモデルを悩ませていた「ゴブリン」問題の根本原因を特定した。報酬シグナルが「オタク(Nerdy)」という性格特性を強化するために使われ、その結果、ファンタジー生物への言及を含む出力が促され、訓練データセットの76.2%が示していた

GateNews11分前

Parallel Web Systems は $100M シリーズB を $2B 評価額で調達し、Sequoia が主導

TechCrunchによると、元TwitterのCEOであるパラグ・アグラワルによって設立されたAIスタートアップ、Parallel Web Systems(パラレル・ウェブ・システムズ)は、Sequoiaが主導したシリーズBで、20億ドルの評価額で1億ドルを調達した。このラウンドにより、同社の累計調達額は2億3000万ドルになり、同社の1億ドルのシリーズAから5か月後となる。Parallel

GateNews41分前

BitMart 暗号通貨取引所 8周年記念晩餐会:台湾のユーザー向けに AI 自動化取引とローカライズされたサービスを導入

BitMart は台北の君品にて 8 周年記念晩餐会を開催し、150 名を超える来賓が出席しました。8 年間の発展を振り返り、ローカライズと AI 自動取引戦略の発表を行いました。BitMart Skill は Blave と連携し、ユーザーはプログラム不要で AI による自動取引を行い、リアルタイムのデータ洞察を得られます。世界のユーザー数は 1300 万を突破し、上場プロジェクト数は 4800 を超え、取引量は 1 兆億ドル超となりました。晩餐会には本物の福の神(財神)と豪華な景品が用意され、台湾に深く根ざす決意を示しました。

ChainNewsAbmedia48分前

ソフトバンクは2026年にRozeを上場する計画で、評価額の目標は1000億ドルです。

《フィナンシャル・タイムズ》(FT)による4月30日の独占報道では、ソフトバンク(SoftBank)は米国で、Rozeという名称の新たな完全独立企業を設立する計画を進めている。事業領域はAIロボットとデータセンターのインフラで、最速で2026年にIPOを完了することを目標としており、バリュエーション目標は1,000億ドルに設定されている。《フィナンシャル・タイムズ》はまた、ソフトバンク内部ではバリュエーション目標およびIPOのタイムラインについて懸念があるとも報じている。

MarketWhisper48分前

Anthropic が総額 9,000 億ドル相当の評価額で資金調達の交渉を進め、取締役会は最速で 5 月に判断

Bloomberg が 4 月 29 日に報じたところによると、人工知能(AI)企業の Anthropic は新たな資金調達ラウンドへの打診を真剣に検討しており、潜在的な評価額は 9,000 億米ドルを超えています。Anthropic は今年 2 月の評価額が約 3,800 億米ドルでした。Bloomberg の報道では、関係者の話として、Anthropic の取締役会は最速で 2026 年 5 月に判断を下す可能性があるとされています。

MarketWhisper52分前

マスク氏のOpenAI訴訟が開廷、創業者のメールで51%の持ち分を主張

The Verge によると 4 月 30 日の報道で、イーロン・マスク(Elon Musk)が OpenAI を訴えた陪審裁判が今週、オークランドの連邦裁判所で開かれた。法廷は順に、2015 年から 2017 年にかけてのメールと創業書類を提示した。提示資料には、マスクが会社名を Freemind にすることを提案したこと、そして 2017 年の株式表により、当時彼が主張していた持ち分の割合が最大 51.2% であったことが含まれている。

MarketWhisper57分前
コメント
0/400
コメントなし