Prime Intellect 開源自演化代理環境,產生 8,000+ 個工具並將工具使用準確率提升至 52.3%

GateNews

根據 Beating,Prime Intellect 已開源一般代理(general-agent),這是一個可自我演化的代理訓練環境,使用雙玩家任務生成機制。該系統透過在任務合成器與求解器之間交替運作,自動生成 4,504 個任務與超過 8,000 個獨特工具,並透過九種策略將挑戰劃分為五個難度層級;這些策略包含限制條件、含噪指令以及跨實體耦合。

在測試中,針對環境中的 4,400+ 條軌跡對一個 30B 參數模型進行微調,使其在 BFCL 基準測試上的工具呼叫準確率從 18.9% 提升至 52.3%,展示了該框架能在不依賴人工標註的靜態資料集的情況下,生成經語意驗證的訓練資料的能力。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆