Google Ra Mắt Gemini 3.1 Flash TTS với Khả Năng Thể Hiện Cảm Xúc Nâng Cao và Hỗ Trợ Nhiều Người Nói

Tin nhắn Gate News, ngày 17 tháng 4 — Google đã công bố Gemini 3.1 Flash TTS, một mô hình nâng cao chuyển văn bản thành giọng nói với các tính năng thể hiện cảm xúc và kiểm soát được tăng cường, vào ngày 15 tháng 4. Mô hình mới sẽ được triển khai dần dần thông qua các API dành cho nhà phát triển, Vertex AI cho doanh nghiệp và các công cụ cộng tác.

Các khả năng cốt lõi của mô hình bao gồm các thẻ âm thanh dựa trên ngôn ngữ tự nhiên để tinh chỉnh tốc độ, ngữ điệu và cảm xúc, cùng với “Director Mode” để chỉ định cảnh và vai trò nhân vật nhằm tạo ra các đầu ra giọng nói tinh tế hơn. Tính năng nhiều người nói cho phép tạo hội thoại đồng thời, giúp luồng trò chuyện tự nhiên hơn, phù hợp cho podcast, nội dung âm thanh và trợ lý AI. Mô hình hỗ trợ hơn 70 ngôn ngữ và phương ngữ, phản ánh giọng và cách diễn đạt theo khu vực cho trải nghiệm giọng nói được bản địa hóa trên toàn cầu.

Google nhấn mạnh hiệu năng và tối ưu chi phí, đạt điểm cao trên các chuẩn đánh giá con người mù trong khi giảm chi phí tính toán nhờ kiến trúc Flash—được thiết kế cho việc triển khai doanh nghiệp quy mô lớn. Âm thanh được tạo ra bao gồm gắn watermark SynthID để nhận diện nội dung do AI tạo ra và chống lại tin giả.

Động thái này phản ánh sự cạnh tranh ngày càng gay gắt trong các giao diện giọng nói. OpenAI đang kết hợp các tính năng giọng nói thời gian thực với AI hội thoại để tạo ra tương tác giống con người, trong khi Meta đang mở rộng đầu tư vào các nhân vật AI với trải nghiệm xã hội dựa trên giọng nói. Các nhà quan sát trong ngành cho rằng dù hoạt động diễn xuất cấp cao và công việc sáng tạo có thể vẫn do con người dẫn dắt trong hiện tại, nhưng các thị trường sản xuất lặp lại và quy mô lớn có thể sẽ chứng kiến việc AI dần được áp dụng trong các lĩnh vực lồng tiếng, quảng cáo và sách nói.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenClaw Phát hành v2026.4.25 với Nâng cấp TTS Lớn và Sáu Nhà cung cấp Dịch vụ Giọng nói Mới

Tin tức Gate, ngày 27 tháng 4 — OpenClaw đã phát hành v2026.4.25 theo mục thay đổi chính thức trên GitHub. Bản cập nhật giới thiệu các nâng cấp toàn diện trên các mô-đun giọng nói, plugin, khả năng quan sát (observability) và tự động hóa trình duyệt. Hệ thống TTS hiện hỗ trợ sáu nhà cung cấp dịch vụ giọng nói mới: Azure Speech,

GateNews29phút trước

Hut 8 Phát Hành Trái Phiếu Đạt Chuẩn Đầu Tư Để Tài Trợ Trung Tâm Dữ Liệu AI Liên Kết Với Google

Tin Cổng, ngày 27 tháng 4 — Hãng khai thác Bitcoin Hut 8 Corp đang phát hành trái phiếu có bảo đảm đạt chuẩn đầu tư để tài trợ cho việc xây dựng một trung tâm dữ liệu 245 megawatt tại St. Francisville, Louisiana, hợp tác với Alphabet Inc. (Google). Các trái phiếu, đáo hạn vào năm 2042, có hướng dẫn giá ban đầu khoảng

GateNews39phút trước

OpenAI và AWS tổ chức sự kiện dành cho khách hàng vào ngày 28 tháng 4

Tin tức từ cổng, ngày 27 tháng 4 — Giám đốc điều hành của OpenAI và Amazon Web Services (AWS) sẽ tổ chức một sự kiện dành cho khách hàng vào ngày mai, 28 tháng 4, theo The Information. OpenAI cho biết hiện tại họ có thể cung cấp tất cả các sản phẩm của mình cho khách hàng của bất kỳ nhà cung cấp dịch vụ đám mây nào

GateNews1giờ trước

Google DeepMind tham gia K-Moonshot của Hàn Quốc để giải quyết các thách thức khoa học với AI

Google DeepMind đã bắt tay hợp tác với Hàn Quốc để cung cấp nền tảng kỹ thuật cho sáng kiến K-Moonshot của quốc gia này, một chương trình quốc gia đầy tham vọng được thiết kế nhằm giải quyết những thách thức khoa học phức tạp nhất của thế kỷ bằng AI. Tóm tắt Google DeepMind hợp tác với Sout

Cryptonews3giờ trước
Bình luận
0/400
Không có bình luận