MITの研究:AIによるファクトチェック精度は21%向上したが、未支援のスキルは低下

MITメディアラボの研究者は、新しい研究によって、ニュースの正確さを評価するためにAIを使う人は、独力で誤情報を見抜く面で効果が低下する可能性があることを見いだした。この研究は4週間にわたり67人の参加者を追跡した。AIの支援により誤情報の検出精度は21%向上した一方で、AIなしで行う新しい評価における参加者の成績は15.3ポイント低下した。この研究は、ChatGPT、Claude、GrokのようなAIチャットボットがオンライン情報の検証にますます使われるようになっていることを受けて行われたもので、これらのツールがユーザーの批判的思考力を育てるのに役立つのか、それともAIシステムへの依存を生むのかという疑問が生じている。

MIT研究者がAI検出システムで67人を追跡

研究者らは、参加者がニュースの評価を行うのを助けるために、OpenAIのGPT-4oとGoogle Searchを組み合わせたシステムを構築した。参加者はまず、見出しと画像が実物か偽物かを独立に判断し、その後GPT-4oとその題材について議論してから最終的な評価を下した。4週間の研究では7,203件のAI会話と4,536件のニュースの真偽に関する判断が生成された。

研究者らはその後、AI支援なしで参加者を新たな、これまで見たことのない内容でテストし、誤情報検出の技能が向上したのか低下したのかを確かめた。チームは、ユーザーとAIの間で交わされた何千もの会話を分析するために、AnthropicのClaude 3.5 Sonnetを用いた。

AIで精度は21%向上、支援なしでは15.3%低下

この研究では、AI支援が支援ありのセッション中に誤情報の検出精度を21%改善したことが分かった。しかし、参加者の新しい評価での成績は、AIなしでは15.3ポイント低下した。この低下は主に、偽ニュースを見分ける能力が低下したことによってもたらされ、実ニュースに対する精度は同じままだった。

研究が古いGPT-4oとClaude 3.5 Sonnetを用いていたため、GPT-5.5や、推論能力がより強いClaude Opus 4.8のような新しいAIモデルでも同様の結果が得られたのかは不明だ。

研究はスキル向上よりも依存リスクを示す

研究者らは、AIはその場のパフォーマンスを高められる一方で、技術への依存を促す可能性があると示唆している。「我々の縦断的な分析は、現在のアプローチが技能の開発よりも信念の修正を優先しており、長く持続する識別力ではなく依存を生み出していることを示しています」と研究は述べた。「AIがますます高度化するにつれ、これらのツールが認知的な依存ではなく批判的思考力を育てるようにすることは、誤情報に対する社会の回復力を維持するために不可欠です。」

MITの研究者によれば、この研究は、AIチャットボットがオンラインでの情報検証にますます使われるようになっている中で行われた。「ChatGPT、Claude、GrokのようなAIアシスタントは、ニュースの見出しや拡散した画像の真偽を見極めることから、医療に関する主張や政治的な噂が本当かどうかに答えることまで、オンライン情報の信頼性を評価するためにますます使われています」と研究者らは書いた。「最近の研究は、そのようなシステムが特定の誤った主張に対する信念を減らし得ることを示唆していますが、これらの会話が人間に誤情報を検出するよう教えるのか、それともAI支援によって誤情報に関する信念を単に移し替えるだけなのかは、依然として不明です。」

AI生成の戦争映像がソーシャルメディアに広がる

この研究は、生成AIによって説得力のある偽ニュースをかつてないほど簡単に作れるようになり、現実的な画像や動画がソーシャルメディアで急速に拡散し、人々が目にしたものを信じやすい傾向を利用できるようになったことを背景としている。

2025年6月にイランのミサイル攻撃がイスラエルに対して行われた後、テルアビブやベン・グリオン空港での破壊を示すと称する動画が、ソーシャルメディア上で広く拡散し、AIが生成したものだと特定される前に何百万回もの再生を獲得した。偽の戦争映像の拡散への懸念は、ソーシャルメディア各プラットフォームにわたって続いた。

X、未開示のAI紛争動画に対する停止方針を発表

Xは3月に、AI生成の紛争動画を開示なしに投稿した場合、収益分配プログラムから作成者を停止すると発表した。「戦争の時期には、現場で本物の情報にアクセスできることが重要です」と、Xのプロダクト責任者ニキータ・ビアーは書いた。「今日のAI技術では、人々を誤解させる内容を作ることは簡単すぎます。」

FAQ

MITの研究者は、AI支援のファクトチェックについて何を見つけましたか? MITメディアラボの研究者は、AI支援が支援ありのセッション中に誤情報の検出精度を21%改善した一方で、AIなしで行う新しい評価では参加者の成績が15.3ポイント低下したことを見いだした。4週間の研究では、67人の参加者を7,203件のAI会話と4,536件のニュースの真偽判断にわたって追跡した。

MITの研究は、参加者の誤情報検出スキルをどのようにテストしましたか? 研究者らは、OpenAIのGPT-4oとGoogle Searchを組み合わせたシステムを構築した。参加者はまず、見出しと画像が実物か偽物かを独立に判断し、その後最終的な評価を下す前に、GPT-4oとその題材について議論した。研究者らはその後、AI支援なしで参加者を新しく、これまで見たことのない内容でテストし、スキルの向上を測定した。

なぜXは、AI生成の戦争動画に停止方針を発表したのですか? Xは3月に、AI生成の紛争動画を開示なしに投稿した場合、収益分配プログラムから作成者を停止すると発表した。この方針は、2025年6月にイランのミサイル攻撃がイスラエルに対して行われた後に偽の映像が広まったことを受けている。その際、テルアビブでの破壊を示すと称するAI生成動画が、偽物だと特定される前に何百万回もの再生を獲得した。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし