Google Gemini 3.1 Flash-Lite 正式推出:輸入價格比 Claude 4.5 Haiku 便宜 75%,GPQA 分數 86.9%

根據 Beating,Google Gemini 3.1 Flash-Lite 已由預覽版轉為一般可用性(GA),時間為 5 月 8 日,成為 Gemini 3 系列中最便宜且最快的模型。輸入定價為每百萬 文字 tokens 0.25 美元,輸出為每百萬 文字 tokens 1.50 美元——其輸入成本比 Claude 4.5 Haiku(1.00 美元)少 75%,輸出則少 70%(5.00 美元)。該模型具備 100 萬 tokens 的上下文窗口,並達到 363 tokens/秒的吞吐量,比前一代 Gemini 2.5 Flash 快 45%。

效能基準顯示,GPQA Diamond(研究生級科學推理)達到 86.9%,超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro(多模態推理)達到 76.8%。早期採用者包括客戶服務平台 Gladly,該公司表示在生產工作負載上成本降低 60%,成功率達到 99.6%,以及 JetBrains,將 Flash-Lite 整合到 IDE 協助工具中。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
回覆
0/400
暫無回覆