2026-05-19 11:34:07
Prime Intellect 開源自演化代理環境,產生 8,000+ 個工具並將工具使用準確率提升至 52.3%
根據 Beating,Prime Intellect 已開源一般代理(general-agent),這是一個可自我演化的代理訓練環境,使用雙玩家任務生成機制。該系統透過在任務合成器與求解器之間交替運作,自動生成 4,504 個任務與超過 8,000 個獨特工具,並透過九種策略將挑戰劃分為五個難度層級;這些策略包含限制條件、含噪指令以及跨實體耦合。 在測試中,針對環境中的 4,400+ 條軌跡對一個 30B 參數模型進行微調,使其在 BFCL 基準測試上的工具呼叫準確率從 18.9% 提升至 52.3%,展示了該框架能在不依賴人工標註的靜態資料集的情況下,生成經語意驗證的訓練資料的能力。