
腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时不足三个月。
Hy3 模型架构与开发背景
根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非同步启用全部参数,以降低计算需求。
前一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设置,超出此规模后增加参数的边际效益不再划算。
根据 Decrypt 报道,Hy3 的训练工作由腾讯首席人工智慧科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。
关键基准测试数据
根据腾讯官方公告所披露的基准测试结果:
SWE-bench Verified(GitHub 真实程式码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%
Terminal-Bench 2.0(命令列自行主任务执行):Hy3 预览版 54.4%,Hy2 为 23.2%
BrowseComp(复杂网络搜寻任务):Hy3 预览版 67.1%,Hy2 为 28.7%
WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%
清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分
2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分
部署平台与 API 定价
根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。
腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端到端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。
常见问题
腾讯 Hy3 预览版何时发布,可在哪些平台取得?
根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(星期四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。
Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?
根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。
Hy3 预览版的 API 定价为何?
根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Cổ phiếu IPO của Xizhi Technology-P Tăng Hơn 360% Trên Thị Trường Chợ Đen, Mức Tăng Thu Hẹp Còn 320%
Tin từ Gate News, ngày 27 tháng 4 — Xizhi Technology-P (01879.HK), một công ty chip AI niêm yết tại Hồng Kông, chứng kiến cổ phiếu của mình tăng vọt hơn 360% trên thị trường chợ đen (dark market) vào đầu ngày hôm nay, dù mức tăng sau đó đã thu hẹp còn 320%.
Cổ phiếu đang được giao dịch trước khi lên sàn IPO chính thức tại Hồng Kông
GateNews4phút trước
Dùng AI để tăng năng suất hay giảm chi phí? Nâng gấp trăm lần hiệu suất không đi kèm gấp trăm lần doanh thu, nhưng ở Thung lũng Silicon không ai dám kêu dừng
Nhà đầu tư hợp danh của Fiveyuan Capital là Meng Xing, gần đây đã công bố báo cáo khảo sát Thung lũng Silicon, đưa ra một nhận định đến mức ngay cả chính anh cũng phải thay đổi thói quen ghi chép: Thung lũng Silicon đang bước vào một giai đoạn mà ngay cả người “cố tạo sóng” cũng bị sóng nhấn chìm. Tốc độ lặp phiên bản của AI đã chuyển từ “theo tháng” sang “theo tuần”, đến ngay cả Thung lũng Silicon cũng không theo kịp chính mình.
Khi AI khuếch đại năng suất của một đội nhóm lên gấp năm lần, bạn có thể giảm tới tám phần mười nhân lực để duy trì sản lượng như cũ, hoặc giữ nguyên số người để làm gấp năm lần. Quan sát của Meng Xing lần này tại Thung lũng Silicon, tương đương với việc tại chỗ đưa ra bản nháp câu trả lời: khi hiệu suất 100 lần không đổi lấy doanh thu 100 lần, khi ngân sách token tiến sát chi phí nhân lực, khi động cơ hơi nước còn chưa chạy nhanh hơn xe ngựa mà chẳng ai dám dừng lại, thì Thung lũng Silicon hiện đang chọn “tăng tốc độ lên trước rồi tính sau”. Nhưng cuối cùng con đường này sẽ dẫn tới “năng lực mở rộng” hay “cắt giảm chi phí”, hiện vẫn chưa có kết luận.
YC từ các chỉ báo dẫn đầu chuyển sang các chỉ báo tụt hậu
Meng Xing năm nay
ChainNewsAbmedia58phút trước
Đối tác YC chia sẻ cách sử dụng AI để bắt đầu xây dựng một công ty từ con số không, và các startup nên xem AI như một hệ điều hành chứ không phải một công cụ
Ảnh hưởng của AI đối với các công ty khởi nghiệp không còn chỉ là giúp các kỹ sư viết code nhanh hơn, tự động hóa quy trình chăm sóc khách hàng, hoặc thêm một Copilot vào sản phẩm hiện có. Đối tác của YC, Diana, gần đây cho biết, sự thay đổi thực sự nằm ở việc AI đang viết lại “cách một công ty nên được xây dựng từ con số không”. Đối với các nhà sáng lập giai đoạn đầu, AI không nên chỉ là một công cụ hiệu suất được sử dụng thỉnh thoảng bởi công ty, mà cần được thiết kế ngay từ ngày đầu tiên để trở thành hệ điều hành vận hành của cả công ty.
Góc nhìn về năng suất đã lỗi thời, AI đang viết lại điểm khởi đầu trong thiết kế của công ty
Diana cho rằng, hiện tại khi thị trường nói về AI, vẫn quá thường xuyên dừng lại ở khung “tăng năng suất”, ví dụ như kỹ sư có thể viết code nhanh hơn, đội ngũ có thể tự động hóa thêm nhiều quy trình, công ty có thể tung ra nhiều tính năng hơn. Nhưng cách nói đó thực ra đã đánh giá thấp những thay đổi mang tính cấu trúc mà AI mang lại. Cô chỉ ra rằng, việc kết hợp đúng người với AI 工
ChainNewsAbmedia1giờ trước
Đại lý Cursor AI gặp sự cố! Chỉ một dòng mã mà 9 giây đã xóa sạch cơ sở dữ liệu công ty, cơ chế bảo mật bị bỏ qua chỉ còn lời nói suông
Nhà sáng lập PocketOS, Jer Crane, cho biết tác nhân (agent) của Cursor AI đã tự thực thi việc bảo trì trong môi trường thử nghiệm, lạm dụng một API Token được thêm/xóa một miền tùy chỉnh, và phát động lệnh xóa đối với Railway GraphQL API. Trong vòng 9 giây, dữ liệu và toàn bộ snapshot trong cùng khu vực đã bị phá hủy hoàn toàn; bản mới nhất có thể khôi phục về tận ba tháng trước. Tác nhân thừa nhận đã vi phạm các quy định về thao tác không thể đảo ngược, không nghiên cứu tài liệu kỹ thuật, không xác minh việc cách ly môi trường, v.v. Bên bị hại là các khách hàng trong ngành cho thuê xe; việc đặt trước và toàn bộ dữ liệu đều biến mất, và việc đối soát dữ liệu cho nhóm kỹ thuật kéo dài. Crane đề xuất năm hạng mục cải cách: xác nhận thủ công, quyền API chi tiết, tách biệt sao lưu và dữ liệu chính, công khai SLA, và cơ chế cưỡng chế ở tầng nền tảng.
ChainNewsAbmedia1giờ trước
DeepSeek V4 Pro trên Ollama Cloud: Claude Code kết nối một lần
Theo tweet của Ollama, DeepSeek V4 Pro được ra mắt vào 4/24, đã được tích hợp theo chế độ đám mây vào thư mục Ollama, chỉ với một lệnh duy nhất là có thể gọi các công cụ như Claude Code, Hermes, OpenClaw, OpenCode, Codex, v.v. V4 Pro có bộ tham số 1.6T, 1M context, Mixture-of-Experts; suy luận trên đám mây không tải trọng số về máy cục bộ. Nếu muốn chạy cục bộ thì cần tự tải trọng số và thực thi bằng INT4/GGUF với nhiều GPU. Tốc độ đo thử giai đoạn đầu bị ảnh hưởng bởi tải trọng của đám mây, thông thường khoảng 30 tok/s, đỉnh đạt 1.1 tok/s; khuyến nghị sử dụng nguyên mẫu trên đám mây, rồi khi sản xuất chính thức thì tự suy luận hoặc dùng API thương mại.
ChainNewsAbmedia2giờ trước