据《纽约时报》报道,谷歌的 AI 概览功能在使用 Gemini 3 时的准确率为 91%,这意味着它每小时会给出数千万条不正确的答案。基于谷歌每年处理超过 5 万亿次搜索,这相当于每分钟出现数十万条不准确的回复。
Oumi 使用 SimpleQA 基准的分析显示,Gemini 2 的准确率为 85%,而 Gemini 3 提升至 91%。
相关快讯
为什么有人觉得 AI 改变世界、有人觉得普通?Karpathy 的两个诊断
Karpathy「讓 LLM 反論自己」:用 AI 反制思考偏誤的 4 步方法
AI 占美国 Q1 GDP 增长 75%,2027 年五大巨头资本支出或将超过 1.1 万亿美元