ゲートニュース 4月22日 — Google Researchは、エージェントのメモリーフレームワークであるReasoningBankをリリースしました。これは、大規模言語モデル主導のエージェントが、デプロイ後も継続的に学習できるようにするものです。このフレームワークは、成功したタスク経験と失敗したタスク経験の両方から普遍的な推論戦略を抽出し、それらをメモリーバンクに保存して、同様の将来のタスクでの検索と実行に活用します。関連論文はICLRで公開されており、コードはGitHubでオープンソース化されています。
ReasoningBankは、既存の2つのアプローチを改良しています。Synapseは完全な行動の軌跡を記録しますが、きめ細かな粒度のために転用可能性が限られています。また、Agent Workflow Memoryは成功したケースのみから学習します。ReasoningBankは2つの重要な変更を行います。"アクションシーケンス"ではなく"推論パターン"を保存し、各メモリにタイトル、説明、コンテンツの構造化フィールドを含めること。そして、失敗の軌跡を学習に取り込むことです。このフレームワークは、実行軌跡を自己評価するモデルを使用し、失敗の経験を「落とし穴回避ルール」へと変換します。たとえば、ルール"見かけたらLoad Moreボタンをクリックする"は、"まず現在のページ識別子を確認し、無限スクロールのループを避けてから、load moreをクリックする"へと進化します。
この論文は、Memory-aware Test-time Scaling (MaTTS)も導入しています。これは推論中に追加の計算を割り当て、複数の軌跡を探索して、その発見をメモリーバンクに保存するものです。並列拡張では同一タスクに対して複数の異なる軌跡を実行し、自己比較によってより頑健な戦略を洗練します。一方で逐次拡張では単一の軌跡を反復的に改良し、推論の途中結果をメモリに保存します。
Gemini 2.5 FlashをReActエージェントとして用いたWebArenaのブラウザタスク、およびSWE-Bench-Verifiedのコーディングタスクでは、ReasoningBankは、メモリなしのベースラインと比べてWebArenaで成功率が8.3%高く、SWE-Bench-Verifiedでは4.6%高くなりました。さらに、タスクあたりの平均ステップ数を約3%減らしました。並列拡張 (k=5)でMaTTSを追加すると、WebArenaの成功率はさらに3ポイント向上し、ステップ数もさらに0.4減少しました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
360のAI脆弱性発見エージェントが約1,000件のゼロデイ脆弱性のエクスプロイトを発見、Mythosと競合
360デジタルセキュリティのAI駆動型エージェントは、OfficeやOpenClawを含む約1,000件の新たな脆弱性を見つけたと主張しています。AIは現在、発見とエクスプロイト・チェーンの準備の中核となっており、Mythosに匹敵するとされています。
要旨:Bloombergで引用された報告によると、360デジタルセキュリティ・グループのAI駆動型「脆弱性発見エージェント」は、ここ数カ月で約1,000件の、これまで未確認だった脆弱性を特定しました。対象にはMicrosoft OfficeやOpenClawのフレームワークが含まれます。同社は、AIが脆弱性発見の中核エンジンになったとしており、エクスプロイト・チェーンの構築を加速するAIツールを発表したとしています。Benincasa氏は、Natto Thoughtsによる同社の中国語による発表内容のレビューに基づき、360をAnthropicのMythosの競合と位置付けています。
GateNews1分前
Aethir Claw V1ローンチ:5分未満でコードなしでAIエージェントをデプロイ
Gate Newsメッセージ、4月22日 — 分散型GPUクラウド基盤プロバイダーのAethirは本日、AIエージェントホスティングプラットフォームであるAethir Clawのバージョン1.0をリリースしました。このプラットフォームは、技術的なバックグラウンドがないユーザーでも、5分未満でブラウザ内だけでAIエージェントをデプロイし、設定できるようにします
GateNews1時間前
Google、企業がタスクを自動化するためのAIエージェントツールを発表
Googleは、専用のエージェント受信トレイを通じてタスクを自動化し、進捗を追跡し、ワークフローを管理するためのAIエージェント構築ツールを明らかにしました。Workspaceのアップデートと、AIエージェントが日々の従業員のルーティンを変えるという構想を示しています.
要旨: Googleは、タスク自動化のためのAIエージェントを作成し、その進捗を監視し、ワークフローを効率化するためのツールを発表しました。Workspaceのアップデートと、AIエージェントが日常業務を変革する未来が示されました.
GateNews2時間前
Microsoft、AIエージェントのコマース基盤を公開:出版社のマーケットプレイス、マーチャント向けプロトコル、広告ツール
ゲートニュース 4月22日号――MicrosoftのAIマネタイズ担当副社長ティム・フランクは、「エージェンティック・ウェブ」の時代に向けた一連の商用インフラ更新を発表した。これにより、AIエージェントがユーザーの代わりに購買判断を行う際にも、出版社、マーチャント、広告主が発見可能で取引可能な状態を維持できるようになる。
GateNews4時間前
NeoCognition、業務で学ぶAIエージェント向けシード資金$40M を調達
Gate Newsメッセージ、4月22日—AI研究ラボのNeoCognitionは、$40 百万ドルのシードラウンド完了を発表し、ステルスモードからの脱却を果たしました。オハイオ州立大学の准教授Yu Suが、Xiang DengおよびYu Guとともに設立した同社は、カリフォルニア州パロアルトに本社を置いています。このラウンド
GateNews5時間前
オンデバイス鍵管理を備えたAIエージェントウォレットをPicWeが発表
PicWeは、リカバリーフレーズ不要のAIエージェント対応、オンデバイス鍵ウォレットであるPicWe Walletのパブリックベータを発表しました。マルチチェーン資産、スワップ、AIが利用可能な自動化をサポートし、RWAインフラを統合することを目指しています。
PicWeは、鍵をオンデバイスに保存し、リカバリーフレーズを排除し、重要な操作をローカルに保つAIエージェント対応ウォレット「PicWe Wallet」のパブリックベータをローンチしました。ベータでは、マルチチェーン資産管理、スワップ、ステーブルコインに基づく手数料をサポートしつつ、プログラマブルなAIによる対話を可能にします。より広範なPicWeの取り組みにより、このプラットフォームは実世界資産(RWA)の統合インフラとして位置づけられ、発行、流通、決済、クロスボーダー決済、トークン化、企業向けユースケースのためのサプライチェーン連携を可能にします。
GateNews5時間前