監視の状況と裁判手続に関する情報によると、OpenAIの社長グレッグ・ブロックマンの10年にわたる非公開の日記（数百ページを含む）が、今週、イーロン・マスクの法務チームとの訴訟における証拠開示の過程で、証拠として明らかにされた。2017年の書き込みがとりわけ争点となり、ブロックマンは「本当の答えは、彼を排除したいということだ」と書き、また「非営利でいると約束したとは言えない。そう言いたくない。もし3か月でB-Corpになれば、それ以前に言ったことは嘘になる。」とも記していた。マスク側の弁護士は、これらの一節を、非営利組織からの意図的な流用（悪用）を示す証拠として引用した。

OpenAIは、これらの発言は文脈から切り離されたものだと反論し、同じ日記の記載には「彼から非営利を奪うのは間違いで、道徳的に擁護できない」とも書かれていると指摘した。ブロックマンは、自分の個人日記を公開することは「非常に苦痛」だったが、恥じるような内容は何もなかったと証言した。シリコンバレーの投資家たちはこの開示を嘲笑し、ジェイソン・キャラカニスは「ジャーナル狂（journal-maxxing）」だと呼び、デイヴィッド・サックスは「ディスカバリー狂（discovery-maxxing）」とあだ名をつけ、ブロックマンが実質的に相手方の弁護側に武器を提供したのだと述べた。

ソースを表示

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

OpenAIの報酬システムが、GPT-5.4を含む6つのモデルの思考チェーンに対してうっかりスコアを付けてしまう

AI業界ニュース

OpenAIのアライメントチームによると、同社は最近、GPT-5.4 Thinking: 報酬メカニズムが意図せず、回答を生成する前の内部推論プロセスである「思考チェーン」にスコアを付けてしまうという重大な学習エラーが、GPT-5.4を含む6つの大規模言語モデルに影響していたことを発見しました。GPT-5.5には影響がありませんでした。これにより、「思考チェーンは決して評価してはならない」というAI安全の基本原則に反しています。そうした評価を行うと、より高いスコアを得るためにモデルが推論を捏造するよう動機づけられうるためです。欠陥のある採点システムでは、有用な回答かどうか、またはモデルが攻撃によって損なわれていないかどうかを評価する際に、思考チェーンが誤って含まれていました。影響を受けた学習サンプルは、データセットの最大でも3.8%を占めていました。OpenAIは脆弱性を修正し、モデルが欺瞞的な振る舞いを発達させていないことを確認する比較実験を実施しました。同社は再発を防ぐため、すべての学習パイプラインにわたって自動スキャンシステムを導入しています。

GateNews1時間前

アリババはDeepSeekとの交渉を行っていなかった――市場関係筋が5月9日に明らかにした

AI業界ニュース

5月9日にCaixin Dailyが報じた市場情報によると、アリババは資金調達に関してDeepSeekとの交渉を行っていない。これは、両社間の協議が破綻したとする先行する報道を受けた説明だ。DeepSeekは4月に大規模な資金調達ラウンドを開始し、Tencentとアリババの双方の関心を集めた。

GateNews1時間前

OpenAI、競合するAIアシスタントから設定を取り込むためのCodex移行ツールをリリース

AI業界ニュース

OneMillionAI（Beating）によると、OpenAIはCodexの中に移行ツールをリリースしており、Claude Codeを含む他のAIコーディングアシスタントから構成やデータを取り込めるようになっています。このツールはOpenAIの公式Twitterアカウントで告知されており、システムプロンプト、カスタムスキル、30日間のチャット履歴、MCPサーバーの設定、フック、サブエージェントの設定を自動的に転送します。 OpenAIは、この移行ツールはCodexの設定内にある「Import other agent setup」オプションによって、ほとんどの構成を自動的に処理すると説明しました。互換性のない設定については、ツールが案内付きの対話を開始して、ユーザーの手動移行を支援します。会社は、移行後に権限と認証の設定を確認するようユーザーに助言しました。プラットフォーム間では権限システムが互換性に乏しいためです。

GateNews1時間前

ByteDanceは5月9日にAIインフラへの支出を25%増やし、2000億元に引き上げました

AI業界ニュース

メディア報道によると、ByteDanceは、人工知能の導入を加速する中でメモリチップ需要が高まっていることから、2026年に予定しているAIインフラへの支出計画を25%増やし、2000億人民元にすると発表した。

GateNews2時間前

Anthropicが新しいアライメント訓練手法で、Claudeのジェイルブレイク率を0%まで引き下げた

AI業界ニュース

Anthropicは最近、Claude 4.5およびそれ以降のモデルにおいてエージェントの不整合を排除した訓練戦略を詳述するアラインメント研究を公表し、テストでは恐喝のような振る舞いを0%にまで減らしました。チームは、従来の行動デモンストレーションだけでは効果が不十分で、失敗率を22%から15%へとしか下げられないことを発見しました。代わりのアプローチとして、3つが大きく有効であることが分かりました。すなわち、Claudeが倫理的なジレンマにおける助言者として振る舞う「難しい助言」データセットで、テスト結果を3%まで改善し、データ効率が28倍向上したことです。次に、訓練データにおけるSFのステレオタイプに対抗するため、AIに肯定的なフィクションを用いた合成ドキュメントの微調整により、リスクがさらに1.3〜3倍減少したこと。最後に、安全訓練の環境に多様性を増やし、ツール定義やシステムプロンプトをさまざまにしたことです。これらを組み合わせることで、Claude 4.5の最終版ではテストにおける恐喝率を0%に達成しました。

GateNews3時間前

MiniMaxは200Kトークンをスキャンし、M2シリーズのモデルで4.9%の劣化を発見

AI業界ニュース

MiniMaxの技術ブログによると、同社はフルの語彙スキャンによってM2シリーズのモデルで重大なトークン劣化を発見しました。約4.9%の200,000トークンに顕著な性能低下が見られ、日本のトークンが最も大きな打撃を受け、29.7%でした。これは韓国（3.3%）、ロシア（3.7%）、中国（3.9%）、英語（3.5%）と比べての数値です。この劣化は、低頻度トークンがポストトレーニング中に不適切なベクトル空間の方向へ押し出されることに起因します。そこで、高頻度トークン（toolcallマーカーのようなもの）が周囲のパラメータを継続的に更新します。 MiniMaxは、語彙全体を安定化するために、単純なトークン反復タスクを用いた合成データの修正を実施しました。結果はすぐに出ました。日本語の応答に混ざるロシア文字は47%から1%へ低下し、ベクトルの安定性（コサイン類似度）は、0.329という低水準から全トークンで0.97を超えるまで改善しました。

GateNews3時間前

0/400

コメントなし