OpenAI CodexチームがOpenClawの認証バグを修正、エージェント挙動を大幅に改善

Gate Newsメッセージ、4月23日— OpenAI Codexチームは、OpenClawにおけるOpenAIモデル体験の最適化に注力しており、CodexのエンジニアリングリードであるTibo SottiauxがOpenClawの作成者Peter Steinbergerと連携しています。CodexプロダクトリードのNik Pashは、重要な認証の不具合を発見しました。OpenClawがOpenAIモデルでCodexハーネスを使用するように設定されていた場合、認証プロセスが失敗し、システムがPiハーネスへサイレントにフォールバックしたため、ユーザーはCodexハーネスが正常に動作していると誤って信じることになりました。

Pashはこの問題に対処するために2つのプルリクエストを提出しました。1つは認証ブリッジを修正し、もう1つはサイレントなフォールバックを防ぐものです。改善の根本は、OpenClawがモデルAPIとどのように通信するかを司る基盤の実行時アダプタ (harness)を切り替えたことにすべて起因しており、エージェントのプロンプトや上位レベルのワークフローのロジックは変更されていません。

修正前後で、エージェントの挙動には明確な違いが見られました。Piハーネスでは、エージェントは各ハートビートごとに浅いポーリングを実行しました。ハートビートファイルを読み取り、Discordを確認し、HEARTBEAT_OKを返して、その他の指示は無視します。オペレーションを推測して実行することもありましたが、ツールコールを発行できませんでした。Codexハーネスへ切り替えた後、エージェントは完全な作業ループに入りました。ワークスペースのコンテキストを読み取り、タスクリストを解析し、リポジトリを確認し、編集を実行し、検証を試みます。以降のハートビートでは、作業を繰り返すのではなく、進捗を再開できるようになりました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Google Jules、エンドツーエンドのエージェント型プロダクト開発プラットフォームとして再ブランディング、新バージョンのウェイリストを開設

Gate News メッセージ、4月23日 — GoogleのJulesチームは、製品の新バージョンに関するウェイリストの開設を発表し、Julesを非同期のコーディングエージェントからエンドツーエンドのエージェント型プロダクト開発プラットフォームへと再配置しました。公式の説明によれば、アップグレードされたプラットフォームはエンティ

GateNews23分前

PerplexityがWeb検索エージェントのポストトレーニング手法を公開;Qwen3.5ベースのモデルが精度とコストでGPT-5.4を上回る

Perplexityは、Qwen3.5モデルを用いたSFTの後にRLを行います。マルチホップQAデータセットとルーブリック(評価基準)チェックを活用して、検索の精度と効率を高め、FRAMESにおいて業界最高水準の性能を達成しています。 要旨:PerplexityのWeb検索エージェント向けポストトレーニングのワークフローは、命令追従と言語の一貫性を強制するための教師あり微調整 (SFT) と、GRPOアルゴリズムによるオンライン強化学習 (RL) を組み合わせています。RL段階では、SFTのドリフトを防ぐために、独自のマルチホップ検証可能QAデータセットと、ルーブリックに基づく対話データを使用し、報酬ゲーティングと同一グループ内の効率ペナルティを採用します。評価の結果、Qwen3.5-397B-SFT-RLがトップのFRAMES性能を達成し、単一ツール呼び出しで57.3%の精度、4回の呼び出しで73.9%の精度を、1クエリあたり$0.02で実現しています。これにより、これらの指標においてGPT-5.4およびClaude Sonnet 4.6を上回ります。料金はAPIベースで、キャッシュは除外されます。

GateNews56分前

OpenAI が ChatGPT Workspace Agents を公開:Codex による駆動、チーム共有、Slack 連携

OpenAIは4月22日にChatGPT Business/Enterprise/Edu/TeachersでWorkspace Agentsを提供開始し、Codexを駆動に、クラウドでの長時間稼働、チームでの共有、オフライン実行に対応します。Slack上で主導的に応答し、請求書発行、複数ステップのワークフローの実行ができ、スケジューリングにも対応しています。研究プレビューは5月6日まで無料で、その後はcredit-basedでの課金となり、価格は未発表です。Google Gemini Enterprise Agent Platform、Anthropic Claude Coworkと同じ土俵で競合しており、3社はいずれも企業向けのエージェントに注力していますが、位置付けはそれぞれ異なります。

ChainNewsAbmedia2時間前

Google Cloud Next 2026:Gemini エンタープライズ・エージェント・プラットフォームを提供、7億5,000万ドルでコンサルの導入を後押し

Google Cloud が Cloud Next 2026 で Gemini Enterprise Agent Platform を発表し、モデルの選択、エージェントの構築、DevOps、オーケストレーション、企業向けのセキュリティ統制を統合するとともに、McKinsey、Accenture、Deloitte が企業エージェントを導入するための 7.5 億ドルの基金を提供した。プラットフォームは Ironwood TPU、A2A、MCP と組み合わせて自社のフルスタックおよびコンサルティング流通網を構築し、OpenAI Operator および Anthropic Claude の企業版に対抗する。

ChainNewsAbmedia2時間前

Google、WizのクラウドセキュリティをAWS、Azure、Google Cloudに拡大

Googleは、新しいセキュリティ機能と、米国$32 10億ドルで買収したイスラエルのクラウドセキュリティ企業Wizとのさらなる統合を発表しました。同社は、Cloud Next '26イベントで、Google Cloudおよび競合プラットフォーム全体にわたりこれを展開しました。会社は、Security Operations向けの3つのAIエージェントをプレビュー・モードで導入し、設計されています。

CryptoFrontier3時間前

360のAI脆弱性発見エージェントが約1,000件のゼロデイ脆弱性のエクスプロイトを発見、Mythosと競合

360デジタルセキュリティのAI駆動型エージェントは、OfficeやOpenClawを含む約1,000件の新たな脆弱性を見つけたと主張しています。AIは現在、発見とエクスプロイト・チェーンの準備の中核となっており、Mythosに匹敵するとされています。 要旨:Bloombergで引用された報告によると、360デジタルセキュリティ・グループのAI駆動型「脆弱性発見エージェント」は、ここ数カ月で約1,000件の、これまで未確認だった脆弱性を特定しました。対象にはMicrosoft OfficeやOpenClawのフレームワークが含まれます。同社は、AIが脆弱性発見の中核エンジンになったとしており、エクスプロイト・チェーンの構築を加速するAIツールを発表したとしています。Benincasa氏は、Natto Thoughtsによる同社の中国語による発表内容のレビューに基づき、360をAnthropicのMythosの競合と位置付けています。

GateNews14時間前
コメント
0/400
コメントなし