Tin nhắn Gate News, ngày 17 tháng 4 — Google đã công bố Gemini 3.1 Flash TTS, một mô hình nâng cao chuyển văn bản thành giọng nói với các tính năng thể hiện cảm xúc và kiểm soát được tăng cường, vào ngày 15 tháng 4. Mô hình mới sẽ được triển khai dần dần thông qua các API dành cho nhà phát triển, Vertex AI cho doanh nghiệp và các công cụ cộng tác.
Các khả năng cốt lõi của mô hình bao gồm các thẻ âm thanh dựa trên ngôn ngữ tự nhiên để tinh chỉnh tốc độ, ngữ điệu và cảm xúc, cùng với “Director Mode” để chỉ định cảnh và vai trò nhân vật nhằm tạo ra các đầu ra giọng nói tinh tế hơn. Tính năng nhiều người nói cho phép tạo hội thoại đồng thời, giúp luồng trò chuyện tự nhiên hơn, phù hợp cho podcast, nội dung âm thanh và trợ lý AI. Mô hình hỗ trợ hơn 70 ngôn ngữ và phương ngữ, phản ánh giọng và cách diễn đạt theo khu vực cho trải nghiệm giọng nói được bản địa hóa trên toàn cầu.
Google nhấn mạnh hiệu năng và tối ưu chi phí, đạt điểm cao trên các chuẩn đánh giá con người mù trong khi giảm chi phí tính toán nhờ kiến trúc Flash—được thiết kế cho việc triển khai doanh nghiệp quy mô lớn. Âm thanh được tạo ra bao gồm gắn watermark SynthID để nhận diện nội dung do AI tạo ra và chống lại tin giả.
Động thái này phản ánh sự cạnh tranh ngày càng gay gắt trong các giao diện giọng nói. OpenAI đang kết hợp các tính năng giọng nói thời gian thực với AI hội thoại để tạo ra tương tác giống con người, trong khi Meta đang mở rộng đầu tư vào các nhân vật AI với trải nghiệm xã hội dựa trên giọng nói. Các nhà quan sát trong ngành cho rằng dù hoạt động diễn xuất cấp cao và công việc sáng tạo có thể vẫn do con người dẫn dắt trong hiện tại, nhưng các thị trường sản xuất lặp lại và quy mô lớn có thể sẽ chứng kiến việc AI dần được áp dụng trong các lĩnh vực lồng tiếng, quảng cáo và sách nói.
Bài viết liên quan
OpenClaw Phát hành v2026.4.25 với Nâng cấp TTS Lớn và Sáu Nhà cung cấp Dịch vụ Giọng nói Mới
Hut 8 Phát Hành Trái Phiếu Đạt Chuẩn Đầu Tư Để Tài Trợ Trung Tâm Dữ Liệu AI Liên Kết Với Google
OpenAI và AWS tổ chức sự kiện dành cho khách hàng vào ngày 28 tháng 4
Google DeepMind tham gia K-Moonshot của Hàn Quốc để giải quyết các thách thức khoa học với AI