Google Cloud 揭露 Gemini 3.2 Flash Lite 模型,其推論成本比 GPT-5.5 低 95%

根據 Beating.AI 監控,截至 5 月 17 日,一個名為 gemini-3.2-flash-lite-live-preview 的新模型選項已出現在 Google Cloud 的模型選擇清單中。「lite」與「live」後綴表示 Google 正在打造一個針對超低延遲即時互動進行最佳化的專用版本。

Abacus.AI 執行長 Bindu Reddy 先前透露,Gemini 3.2 Flash 在保持推論成本僅為 GPT-5.5 的 1/20 的同時,達到 GPT-5.5 的 92% 程度的編碼與推理能力,而多數查詢的回應時間低於 200 毫秒。產業觀察者預期,這款注重成本優化的輕量模型將於 5 月 20 日在 Google I/O 上正式發表。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
回覆
0/400
暫無回覆