10 年未来公司 Thinking Machines 发表即时互动 AI 模型,主打「边说边聽边作业」

鏈新聞abmedia

由前 OpenAI 前高層 Mira Murati 与 John Schulman 共同創辦、百亿美元估值的人工智慧新創公司 Thinking Machines,週二推出首个能「边说边聽」的全雙工 AI 模型预覽版,延遲低至 0.4 秒,挑戰现有人机即时互动模式。

(輝达注资 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能)

Thinking Machines 新模型:打破輪流说話的舊模式

现有所有主流 AI 模型,运作方式都是「使用者输入,模型等待,然后回应」。前 OpenAI 技術长 Mira Murati 与 OpenAI 共同創辦人 John Schulman 认为这種輪流回覆的过程就像傳訊息,並不是真正的对話。如今两人聯手創立的 Thinking Machines Lab,於 5 月 11 日正式发表全新「互动模型(Interaction Models)」的研究预覽版,試圖从根本上改變这个现狀。

人們可以同时交談、傾聽、觀看、思考並協作,且是在即时的狀態下。我們设计了一種以同樣方式与人合作的 AI。

我們分享我們的做法、早期成果,以及模型实际运作的快速一瞥。pic.twitter.com/uxl1InS6Ay

— Thinking Machines (@thinkymachines) May 11, 2026

Thinking Machines 指出,当前 AI 模型以單執行緒感知现实:使用者沒说完,模型只能等待;模型沒生成完,感知就凍結。这種设计成为人机協作的瓶頸,让人无法像与真人溝通般自然流暢地与 AI 協作。

两人相信,解法不在於用外部元件修補舊架構,而是从头訓練一个原生支援即时互动的模型。

全雙工架構:能一心二用的 AI 系统

Thinking Machines 发布的模型命名为 TML-Interaction-Small,是一个擁有 2,760 亿參數、实际运作啟动 120 亿參數的混合專家(MoE)架構模型。該系统以 200 毫秒为單位,持续交错處理输入与生成输出,不设定任何人为的輪次边界,真正实现所謂「全雙工(Full Duplex)」互动,就如同打电話,而非傳訊息。

系统採用雙模型设计:「互动模型」负责即时对話、接話与回应;「背景模型」則在后台非同步處理複雜推理、網路搜尋与工具呼叫,再將結果无縫融入进行中的对話。这使 AI 能夠在说話或聆聽的同时,也悄然完成被指派的搜尋或生成圖表任務。

基準測試:全面超越 OpenAI 与 Google

公告指出,在衡量 AI 互动品质的標準測試 FD-bench 中,TML-Interaction-Small 的換話延遲为 0.40 秒,接近人類自然对話的反应速度,远優於 Google Gemini-3.1-flash-live 的 0.57 秒,以及 GPT-realtime-2.0 的 1.18 秒。

深色代表每列表现最佳者,淺色代表即时模型中表现最佳者

来到該團队專为新型互动能力所设计的自有測試,在「时间感知(TimeSpeak)」任務中,TML-Interaction-Small 正確率达 64.7%,GPT-realtime-2.0 僅有 4.3%;在「语音觸发」任務(CueSpeak)中,前者达 81.7%,后者僅 2.9%;在「視覺计數」任務(RepCount-A)中,前者达 35.4%,后者幾乎为零(1.3%)。

Thinking Machines 指出,现有任何商业模型都无法有意義地完成这些任務,包括 OpenAI 与 Google 的思考版(thinking)高階模型。

企业应用潛力:从客服到安全監控

除了更自然的日常对話體验,这項技術在企业场景中的潛在价值同樣值得关注。

以製造业或实验室为例,一个能即时監控影像的 AI,可在偵測到安全違規的瞬间主动发出警报,而无需等待工作人員开口詢问。在语音客服领域,现有系统普遍存在一至两秒的處理延遲,往往是使用者最直接的痛点,而 0.4 秒的回应速度有望根本解決此问題。

目前 TML-Interaction-Small 及其配套的背景模型,僅开放給少數合作夥伴进行研究预覽,公开版本预计於今年稍后推出。Thinking Machines 同时宣布將啟动研究補助计畫,鼓勵学術社群开发更多評測互动品质的新框架。

从人才流动走向穩定成长:Thinking Machines Lab 的下一步

2025 年剛成立的 Thinking Machines Lab,今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 资深工程師 Soumith Chintala 出任技術长而引发外界关注,目前員工規模已成长至约 130 人。

(祖克柏挖角吞敗仗:拒絕 Meta 六年 15 亿美元邀约的 Andrew Tulloch 是誰?)

今年 3 月,公司也宣布与 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系统,並擴大与 Google Cloud 的合作,推进前沿模型訓練与強化学習研究。

这篇文章 百亿新創 Thinking Machines 发表即时互动 AI 模型,主打「边说边聽边作业」 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论