根據 Cursor 近期的披露,該公司推出一種名為 autoinstall 的訓練技術,供其 Composer 模型系列使用:採用上一代模型,為下一代強化學習自動設置可執行的環境。在訓練 Composer 2 時,Cursor 使用了 Composer 1.5 來完成這項任務。該方法分兩步進行:首先,代理會閱讀程式碼倉庫的文件與設定,以產生 10 個驗證指令及其預期輸出;其次,另一名代理會使用其中 3 個指令,從零開始設定環境,直到指令能成功執行為止,最多嘗試 5 次重試。Composer 2 在衡量環境設定能力的基準測試 Terminal-Bench 上達到 61.7% 的分數,較 Composer 1.5 的 47.9% 高出 14 個百分點。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Tether 的 17 億醫療 AI 模型今天表現優於 16 倍規模的競爭對手
根據 Tether 的 AI 研究團隊,該公司今天推出 QVAC MedPsy 系列醫療語言模型,旨在不依賴雲端的情況下,支援在智慧型手機與穿戴式裝置上進行本地部署。該 17 億參數版本在七項醫療基準上得分 62.62,超越 Google MedGemma-4B
GateNews2分鐘前
Anthropic 預上市估值達到 1.2 萬億美元,較 OpenAI 高出 20%
根據 Odaily,Anthropic 在基於區塊鏈的上市前(pre-IPO)市場中的隱含估值達到 1.2 萬億美元,較 OpenAI 約高出 20%。若公司以此估值上市,其市值將在全球範圍內成為第 11 大最大公開上市公司,位居 Apple 之後,
GateNews7分鐘前
南韓股市反彈在 AI 熱潮推動下,跑贏全球市場
南韓股市正經歷前所未有的漲勢,受人工智慧相關的半導體個股推動。根據 Financial Modeling Prep 的資料、並由 Axios 分析引用,今年 KOSPI 指數上漲 78%,在全球所有其他主要市場之上。
AI
Crypto Frontier15分鐘前
DeepL 將裁減 25% 員工(約 250 名員工)以重組 AI 事業
根據《彭博》,翻譯工具公司 DeepL 今日(5 月 7 日)宣布,將裁撤約 25% 的員工,約 250 名員工,以因應由人工智慧驅動的結構性變化。執行長 Jarek Kutylowski 在 LinkedIn 上表示,公司將減少管理人員……
GateNews45分鐘前
NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態
NVIDIA 公布 Nemotron 3 Nano Omni 開源多模態模型,將視覺、語音與語言整合於單一模型,作為 AI 代理的感知層。核心為 30B-A3B MoE、256K context、9x 吞吐,支援文字、影像、音訊、影片等輸入,輸出為文字。與 Nemotron 3 Super/Ultra 協同,適用電腦操作、文件智慧與音畫理解等場景,並公開權重與訓練資料,部署覆蓋本地、NIM 與第三方平台。
鏈新聞abmedia1小時前
OpenAI DevDay 2026 將於 9/29 舊金山舉辦
OpenAI 公告 DevDay 2026 將於 9/29 在舊金山以實體形式舉行,並設以 GPT-5.5 與 Image Gen 創作的投稿比賽,Codex 每週自動篩選 2–3 件,獲勝者可享免費門票與跨城機票與飯店。大會聚焦 GPT‑5.5 生態與人機協作評選,參賽需滿 18 歲且非 OpenAI 員工直系親屬。觀察焦點包括新模型、代理整合及多雲策略。
鏈新聞abmedia1小時前