百億新創 Thinking Machines 發表即時互ativo AI 模型,主打「邊說邊聽邊作業」

由前 OpenAI 前高層 Mira Murati 與 John Schulman 共同創辦、百億美元估值的人工智慧新創公司 Thinking Machines,週二推出首個能「邊說邊聽」的全雙工 AI 模型預覽版,延遲低至 0,4 秒,挑戰現有人機即時互動模式。

(輝達注資 Thinking Machines Lab 部署 Vera Rubin 提升前沿模型效能)

Thinking Machines 新模型:打破輪流說話的舊模式

現有所有主流 AI 模型,運作方式都是「使用者輸入,模型等待,然後回應」。前 OpenAI 技術長 Mira Murati 與 OpenAI 共同創辦人 John Schulman 認為這種輪流回覆的過程就像傳訊息,並不是真正的對話。如今兩人聯手創立的 Thinking Machines Lab,於 5 月 11 日正式發表全新「互動模型(Interaction Models)」的研究預覽版,試圖從根本上改變這個現狀。

People talk, listen, watch, think, and collaborate at the same time, in real time. We’ve designed an AI that works with people the same way.

We share our approach, early results, and a quick look at our model in action. pic.twitter.com/uxl1InS6Ay

— Thinking Machines (@thinkymachines) May 11, 2026

Thinking Machines 指出,當前 AI 模型以單執行緒感知現實:使用者沒說完,模型只能等待;模型沒生成完,感知就凍結。這種設計成為人機協作的瓶頸,讓人無法像與真人溝通般自然流暢地與 AI 協作。

兩人相信,解法不在於用外部元件修補舊架構,而是從頭訓練一個原生支援即時互動的模型。

全雙工架構:能一心二用的 AI 系統

Thinking Machines 發布的模型命名為 TML-Interaction-Small,是一個擁有 2760 億參數、實際運作啟動 120 億參數的混合專家(MoE)架構模型。該系統以 200 毫秒為單位,持續交錯處理輸入與生成輸出,不設定任何人為的輪次邊界,真正實現所謂「全雙工(Full Duplex)」互動,就如同打電話,而非傳訊息。

系統採用雙模型設計:「互動模型」負責即時對話、接話與回應;「背景模型」則在後台非同步處理複雜推理、網路搜尋與工具呼叫,再將結果無縫融入進行中的對話。這使 AI 能夠在說話或聆聽的同時,也悄然完成被指派的搜尋或生成圖表任務。

基準測試:全面超越 OpenAI 與 Google

公告指出,在衡量 AI 互動品質的標準測試 FD-bench 中,TML-Interaction-Small 的換話延遲為 0,40 秒,接近人類自然對話的反應速度,遠優於 Google Gemini-3.1-flash-live 的 0,57 秒,以及 GPT-realtime-2.0 的 1,18 秒。

深色代表每列表現最佳者,淺色代表即時模型中表現最佳者

來到該團隊專為新型互動能力所設計的自有測試,在「時間感知(TimeSpeak)」任務中,TML-Interaction-Small 正確率達 64,7%,GPT-realtime-2.0 僅有 4,3%;在「語音觸發」任務(CueSpeak)中,前者達 81,7%,後者僅 2,9%;在「視覺計數」任務(RepCount-A)中,前者達 35,4%,後者幾乎為零(1,3%)。

Thinking Machines 指出,現有任何商業模型都無法有意義地完成這些任務,包括 OpenAI 與 Google 的思考版(thinking)高階模型。

企業應用潛力:從客服到安全監控

除了更自然的日常對話體驗,這項技術在企業場景中的潛在價值同樣值得關注。

以製造業或實驗室為例,一個能即時監控影像的 AI,可在偵測到安全違規的瞬間主動發出警報,而無需等待工作人員開口詢問。在語音客服領域,現有系統普遍存在一至兩秒的處理延遲,往往是使用者最直接的痛點,而 0,4 秒的回應速度有望根本解決此問題。

目前 TML-Interaction-Small 及其配套的背景模型,僅開放給少數合作夥伴進行研究預覽,公開版本預計於今年稍後推出。Thinking Machines 同時宣布將啟動研究補助計畫,鼓勵學術社群開發更多評測互動品質的新框架。

從人才流動走向穩定成長:Thinking Machines Lab 的下一步

2025 年剛成立的 Thinking Machines Lab,今年稍早才剛因多名創始成員出走至 Meta、延攬 PyTorch 創始人暨 Meta 資深工程師 Soumith Chintala 出任技術長而引發外界關注,目前員工規模已成長至約 130 人。

(祖克柏挖角吞敗仗:拒絕 Meta 六年 1500 億美元邀約的 Andrew Tulloch 是誰?)

今年 3 月,公司也宣布與 Nvidia 合作部署至少一吉瓦的新世代 Vera Rubin 系統,並擴大與 Google Cloud 的合作,推進前沿模型訓練與強化學習研究。

這篇文章 百億新創 Thinking Machines 發表即時互動 AI 模型,主打「邊說邊聽邊作業」 最早出現於 鏈新聞 ABMedia。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

¡Transformers en versión humana! Tech de Youshu presenta el primer vehículo robótico de producción masiva del mundo, con un precio de 570 mil dólares.

La empresa china de robótica Unitree Robotics (宇树科技) con sede en Hangzhou anunció el 12 de mayo su nuevo producto GD01: un mecha transportable tripulado que puede cambiar libremente entre los modos bípedo humanoide y de escalada cuadrúpeda. Se puede decir que esta presentación traslada a la vida real las escenas de las películas de ciencia ficción “Transformers” y “Pacific Rim”. Esta vez, el lanzamiento no es solo una maravilla tecnológica, sino que también refleja el rápido impulso de la indust

ChainNewsAbmediaHace49m

Thinking Machines Model T empata a GPT-Realtime-2 por el primer puesto en el benchmark de audio de hoy con una puntuación APR del 43,4%

Según el último benchmark Audio MC S2S de Scale Labs, publicado hoy, el modelo TML-Interaction-Small de Thinking Machines logró 43,36 puntos, empatando en el primer puesto con el GPT-Realtime-2 (xHigh) de OpenAI, con una puntuación de APR de 43,4%. El líder absoluto en puntuación, GPT-Realtime-2 (xHigh), obtuvo 48,45 puntos, mientras que TML-Interaction-Small lo siguió con 43,36 puntos; la diferencia se mantuvo dentro de los márgenes de error estadístico, lo que dio lugar a un empate oficial en

GateNewshace1h

Arthur Hayes predice que Bitcoin volverá a $126.000 en medio de la carrera armamentística de IA entre EE. UU. y China y la inflación de guerra

De acuerdo con Odaily, Arthur Hayes publicó un artículo titulado «The Butterfly Touch» el 12 de mayo, en el que predice que Bitcoin volverá a 126.000 dólares como resultado de la competencia de gasto en IA entre EE. UU. y China y de la inflación impulsada por la guerra. Hayes afirmó que el mercado alcista cripto se lanzó oficialmente después de la acción militar de EE. UU. contra Irán el 28 de febrero de 2026, y que Bitcoin ya había formado una base alrededor de 60.000 dólares. Espera ganancias

GateNewshace1h

HrdWyr recauda $13M Serie A para el desarrollo de chips de IA

La startup de chips sin fábrica (fabless) con sede en Bengaluru, HrdWyr, recaudó 13 millones de USD en una ronda de financiación Serie A liderada por la firma de capital de riesgo de Bengaluru, Ideaspring Capital, el 12 de mayo. Singularity AMC, Avatar Growth Capital y Persistent Systems también participaron en la ronda. La empresa planea usar la financiación para desarrollar sus productos de system-on-chip (SoC) nativos de IA y ampliar el compromiso con clientes en mercados globales, con un enf

CryptoFrontierhace1h

Los empleos en IA en India aumentan 15-20%, afirma el ministro en la cumbre de CII

El ministro de Electrónica de la Unión y de TI de la India, Ashwini Vaishnaw, anunció que los empleos relacionados con IA están aumentando entre un 15% y un 20%, con base en comentarios de la industria de TI, durante su intervención en la CII Annual Business Summit. Instó a las empresas a colaborar con Nasscom para capacitar a trabajadores en la nueva tecnología, a medida que el sector de TI atraviesa una transformación. El ministro también destacó importantes compromisos de inversión y planes d

CryptoFrontierhace1h

Se proyecta que el proyecto de OpenAI ahorre 97 mil millones de dólares en pagos a Microsoft para 2030 bajo un nuevo acuerdo

Según The Information, se proyecta que OpenAI ahorrará aproximadamente 97 mil millones de dólares en pagos a Microsoft para 2030 bajo el acuerdo de colaboración revisado negociado en octubre del año pasado. La directora financiera Sarah Friar les dijo a los inversores que la empresa espera compartir el 8-10% de los ingresos con todos los socios comerciales, incluido Microsoft, por debajo del 20% actual.

GateNewshace1h
Comentar
0/400
Sin comentarios