
輝達(NVIDIA)執行長黃仁勳於 6 月 1 日在台北電腦展(Computex)主題演講中發布 Nemotron 3 Ultra,這款開放式權重模型在 Artificial Analysis 與輝達聯合預發布評估中獲得智慧指數 48 分,但輸給中國 Moonshot AI 的 Kimi K2.6,後者 54 分。
Nemotron 3 Ultra 技術規格:550 億活躍參數、百萬 Token 上下文窗口與 6 月 4 日出貨
Nemotron 3 Ultra 採用混合專家(MoE)架構:總參數 5,500 億,任意時刻僅激活其中 550 億個活躍參數,結合 Mamba-2 層、標準 Transformer 注意力機制和混合專家路由。模型支援 100 萬個 token 的上下文窗口,並採用多詞元預測(MTP)技術提升生成速度。
輝達表示,與同類開放式權重模型相比,Ultra 的推理速度快 5 倍,成本低 30%。在 DeepInfra 預發布端點上,該模型每秒可處理超過 300 個輸出 token;相比之下,DeepSeek V4 Pro 和 Kimi K2.6 透過商業 API 每秒僅處理 50 至 100 個 token。模型權重公開,訓練方案已發布,正式出貨日期為 2026 年 6 月 4 日。
美國與中國開源 AI 智慧指數直接比較:Artificial Analysis 數據
根據 Artificial Analysis 發布的評估數據,主要模型的智慧指數排名如下:全球閉源旗艦模型(Anthropic、Google、OpenAI)均為 57 分;Kimi K2.6(Moonshot AI,中國,2026 年 4 月發布)54 分,全球排名第四;Nemotron 3 Ultra(輝達,美國)48 分,美國開源第一;Google Gemma 4 31B(美國)39 分;Nemotron 3 Super(輝達,2026 年 3 月,120B 參數)36 分;OpenAI gpt-oss-120b(美國)33 分。智慧指數為匯總 10 項評估(推理、編碼、一般知識、智能體性能)的綜合基準,分數越高代表越強。
Nemotron 聯盟與 Nemotron 4:已確認的下一代開發框架
輝達於台北電腦展同步宣布,Nemotron 4 已在開發中,由輝達於 2026 年 3 月組建的 Nemotron 聯盟負責,成員包括 Mistral AI 和 Perplexity 在內的 8 個 AI 實驗室,基於 DGX 雲端基礎設施共同開發。
輝達此前已公開宣布五年 260 億美元的開源 AI 投資計劃,Nemotron 3 Ultra 是截至目前最具代表性的成果。中國開源模型的全球開源使用量佔比已從 2024 年底的約 1.2% 增長至 2025 年底的約 30%(來源:Decrypt,2026 年 3 月報道)。
常見問題
Nemotron 3 Ultra 與上一代 Nemotron 3 Super 相比有何提升?
Nemotron 3 Super 於 2026 年 3 月發布,擁有 1,200 億個參數,智慧指數 36 分;Nemotron 3 Ultra 的智慧指數為 48 分,同比提升 12 分。輝達表示,12 分的提升在基準測試領域屬於顯著飛躍。
Kimi K2.6 的智慧指數為何高於輝達 Nemotron 3 Ultra?
中國 Moonshot AI 的 Kimi K2.6 智慧指數 54 分,比 Nemotron 3 Ultra 的 48 分高出 6 分,在全球所有模型(含閉源)中排名第四,僅落後於 Anthropic、Google 和 OpenAI 旗艦閉源模型(各 57 分)3 分。美國 OpenAI、Anthropic 和 Google 傾向於將最強模型保留在 API 背後,而中國實驗室則持續向開源生態系統貢獻高分模型。
Nemotron 3 Ultra 的速度優勢在哪些場景中最為關鍵?
Ultra 每秒處理超過 300 個輸出 token,比 DeepSeek V4 Pro 和 Kimi K2.6 的商業 API 速度快三至六倍。輝達指出,這一優勢在自主 AI 代理執行長時間多步驟任務時尤為重要,因為每步等待時間會在複雜任務中快速累積。