根據《紐約時報》,Google 的 AI Overview 功能在使用 Gemini 3 時的準確率為 91%,這表示它每小時會輸出數千萬則不正確答案。以 Google 每年處理超過 5 兆次搜尋量計算,這相當於每分鐘會出現數十萬則不正確回覆。
Oumi 使用 SimpleQA 基準進行分析後指出,Gemini 2 的準確率為 85%,而 Gemini 3 則提升至 91%。
Related News
為什麼有人覺得 AI 改變世界、有人覺得普通?Karpathy 的兩個診斷
Karpathy「讓 LLM 反論自己」:用 AI 反制思考偏誤的 4 步方法
AI 占美國 Q1 GDP 成長 75%,2027 五大巨頭資本支出或超過 1.1 兆美元