Step Audio 2,5 Real-time Dirilis: Skor Subjektif 80,41 Menghancurkan GPT-Realtime-1,5 sebesar 18%, Panggilan Suara Menelan Biaya 3,8 Yuan/Jam

Menurut Beating, Step Audio 2.5 Realtime, sebuah model suara real-time end-to-end oleh Step Cosmos, diluncurkan di API platform open pada April 2026. Model ini menekankan percakapan yang alami dengan persona karakter yang dapat disesuaikan serta persepsi paralinguistik (nada, jeda, desah).

Dalam pengujian resmi di lima dimensi, Step Audio 2.5 Realtime meraih peringkat pertama di semua kategori. Skor evaluasi subjektif (percakapan di aplikasi telepon pengguna nyata) mencapai 80,41, dibanding 68,01 untuk GPT-Realtime-1.5 dan 67,16 untuk Gemini Live. Skor benchmark Voice Q&A mencapai 79,80, hampir 1,5 kali skor GPT-Realtime-1.5 sebesar 53,20. Harga API: 10 yuan per 1 juta token input (2 yuan dengan cache hits), 70 yuan per 1 juta token output, dengan perkiraan panggilan suara berkelanjutan sebesar 3,8 yuan per jam.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar