Menurut Beating, Thinking Machines—lab yang didirikan oleh mantan CTO OpenAI Mira Murati—merilis pratinjau riset dari model Interaction, yang menampilkan pemrosesan audio dan video real-time native dengan respons micro-turn 200 milidetik. Model ini memungkinkan pendengaran, penglihatan, dan berbicara secara bersamaan sekaligus mendukung interupsi pengguna secara real-time.
Model TML-Interaction-Small menggunakan arsitektur MoE berparameter 276 miliar dengan 12 miliar parameter yang aktif per inferensi. Data resmi menunjukkan latensi speech turn-taking 0,40 detik dan skor FD-bench V1.5 sebesar 77,8, keduanya mengungguli GPT-Realtime-2.0 dan Gemini 3.1 Flash Live. Akses pratinjau terbatas direncanakan untuk beberapa bulan mendatang.
Related News
OpenAI juga mengikuti gaya konsultan ala Palantir? Menggelontorkan 4 miliar dolar AS untuk membentuk perusahaan independen, menempatkan FDE ke dalam perusahaan untuk integrasi mendalam workflow AI
OpenAI mendukung 4 miliar dolar perusahaan deployment: akuisisi Tomoro
Karyawan OpenAI Menjual Saham Senilai $6,6 Miliar, Dengan Keuntungan Rata-Rata $11 Juta per Orang