Yu 拥有圣母大学（2023）计算机科学博士学位，并已发表 30 多篇顶级会议论文，累计超过 5,700 次引用。他的研究聚焦于强化学习后训练、推理和智能体。在腾讯，他领导了 WebVoyager 项目，该项目被 OpenAI 和 Google 采用。他在自博弈机制和智能体系统方面的专长，与 OpenAI 当前通过强化学习增强模型推理能力的策略相契合。

View Source

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

微软开源 Phi-Ground 4B 模型，在屏幕点击准确率方面优于 OpenAI Operator 和 Claude

AI 行业动态

据 Beating 称，微软最近开源了 Phi-Ground 模型家族，旨在解决“AI 应该在计算机屏幕上点击哪里”的问题。该 40 亿参数版本，并结合用于指令规划的更大语言模型，在 Showdown 基准测试中超过了 OpenAI Operator 和 Claude Computer Use 的点击准确率，并在包括 ScreenSpot-Pro 在内的五项评估中位列所有 100 亿以下参数模型的第一名。团队在超过 4000 万个数据样本上进行了训练，并发现学术论文中使用的三种常见训练技术在规模化时变得无效。关键思路证明很简单：以常规数字输出坐标，例如“523, 417.” 先前的研究为坐标发明了专门的位置词汇，但这些方法无法规模化。团队还发现，将文本指令放在图像之前可以提升性能，因为模型在处理像素时能够识别目标。此外，诸如 DPO 之类的强化学习方法在微调之后仍能提高准确率。

GateNews30 分钟前

Tilde Research 发现 Muon 优化器会杀死 25% 的神经元；Aurora Alternative 实现 100 倍的数据效率提升

AI 行业动态

据 Tilde Research 称，领先 AI 模型所采用的 Muon 优化器（包括 DeepSeek V4 和 Kimi K2.5）存在隐藏缺陷：它会导致在早期训练期间，MLP 层的神经元中有超过 25% 会永久死亡。团队设计了 Aurora 作为替代优化器，并将其开源。一个仅用 100B tokens 训练的 11 亿参数模型，在 HellaSwag 和 Winogrande 等语言理解基准上，其表现与在 36T tokens 上训练的 Qwen3-1.7B 相当，展现了约 100 倍的数据效率提升。与 Muon 相比，Aurora 的计算开销增加 6%，并可作为直接替代。

GateNews50 分钟前

英伟达在 2026 年初承诺投入超过 400 亿美元用于 AI 投资，其中包括 300 亿美元给 OpenAI

AI 行业动态

据 TechCrunch 报道，英伟达在 2026 年前几个月承诺向 AI 公司进行的股权投资超过 400 亿美元，其中对 OpenAI 的投资 300 亿美元是单笔最大承诺。该芯片制造商还承诺向玻璃制造商康宁（Corning）最高投资 32 亿美元，并向数据中心运营商 IREN 投资最高 21 亿美元，其中包括一份为期五年的认股权证，以及一份用于托管 GPU 云服务的单独合同，合同金额为 34 亿美元，所使用的是英伟达 Blackwell 系统。根据 FactSet 数据，英伟达今年宣布了对上市公司的 7 笔多十亿美元投资，同时还参与了约两打（约二十多笔）面向私营初创企业的融资轮次。

GateNews4小时前

英伟达开放AI长期合作伙伴 Deepinfra 获 1.07 亿美元 B 轮融资，建立「代币工厂」

AI 行业动态

人工智慧新創 DeepInfra 宣佈完成 1.07 亿美元 B 輪融资，由 500 Global 与 Google 早期工程師 Georges Harik 领投，輝达 (NVIDIA)、Samsung Next 及 Supermicro 等策略投资者跟投。據官方消息透露，本次注资將用於擴展全球资料中心容量，解決当前人工智慧应用从「模型訓練」转向「大規模推理」时所面臨的运算成本以及效率瓶頸。 AI 推理需求激增成为企业部署关鍵瓶頸人工智慧邁向商业化，企业的工作负載重心已发生顯著位移。DeepInfra 觀測到自 A 輪融资以来其平台處理的 Token 量增长达 25 倍，顯示出 Inference (推理) 已成为驅动企业人工智慧负載的主力，当前开源模型效能已能与專有系统媲美，大幅降低創新门檻，然而随之而来的自主智慧體（Agentic Systems）应用，單一任務可能需觸发上百次模型，由於傳统通用型雲端平台非依據推理需求所设计，導致企业面臨營运成本过高与延遲不可控等挑戰，使推理成为工作负載的系统约束。垂直整合堆疊優化代币经濟效能 DeepInfra 採取垂直整合策略，主張高效能推

鏈新聞abmedia4小时前

欧洲央行管委会成员埃斯克里瓦在 5 月 9 日就 AI 对金融基础设施的风险发出警示

AI 行业动态

欧洲央行管委会成员埃斯克里瓦（Escrivá）在 5 月 9 日表示，鉴于人工智能的发展，央行必须重新评估金融基础设施的韧性以及网络安全的稳健性。根据他在一场活动上的讲话，近期人工智能的进展促使人们重新评估金融体系应对新兴风险的能力。

GateNews4小时前

SpaceX 将 xAI 重新命名为 SpaceXAI，并在 17500亿亿美元 IPO 前申请了 Orbital Computing 商标

AI 行业动态

根据向美国专利商标局提交的商标文件，Elon Musk 的人工智能公司 xAI 正在以新品牌 SpaceXAI 的名义并入 SpaceX。此次更名涵盖基于卫星的数据中心、轨道计算、云计算，以及通过基于太空的平台进行 AI 工作负载管理。Musk 证实，xAI 将作为独立公司解散，AI 产品将以其自有标识并带有自己的标识在 SpaceXAI 下运营。此举与 SpaceX 与 Anthropic 的重大算力协议同时发生。在该协议中，AI 公司将从位于田纳西州孟菲斯的 SpaceX Colossus 1 超级计算机租赁算力，获得超过 300 兆瓦的电力以及超过 220,000 台 Nvidia GPU 的算力。分析师估计，Anthropic 这笔交易可能为 SpaceX 每年带来 30 亿美元至 60 亿美元的收入。此次更名发生之际，SpaceX 正在为一场据称估值高达 1.75 万亿美元的 IPO 做准备。

GateNews6小时前

0/400

暂无评论