Theo Beating, xAI đã ra mắt Grok Custom Voices và Voice Library, cho phép người dùng ghi 1 phút âm thanh trong bảng điều khiển xAI để tạo một voice_id tùy chỉnh nhằm sử dụng với các API Grok TTS và Voice Agent. Tính năng này hỗ trợ nhiều ứng dụng như tác nhân dịch vụ khách hàng, tạo nội dung, nhân vật trong game và lồng tiếng sách nói.
Quy trình clone giọng nói bao gồm bước xác minh: người dùng phải đọc một câu trích dẫn kiểm tra, hệ thống sẽ phiên âm theo thời gian thực và đối chiếu với toàn bộ bản ghi để xác nhận danh tính người nói trước khi tạo giọng nói. Bảng điều khiển cho phép tối đa 30 giọng nói tùy chỉnh miễn phí; việc tạo API chỉ khả dụng cho các nhóm Enterprise. Custom Voices hiện có tại Mỹ, trừ Illinois. Việc sử dụng API được đo riêng.