小米开源 OmniVoice,支持 646 种语言的零样本语音克隆模型

据 Beating 称,Xiaomi 的 AI Lab Kaldi 团队已开源 OmniVoice,这是一种零样本语音克隆 TTS 模型,支持 646 种语言。该模型仅需几秒钟的参考音频即可克隆语音特征,并可跨语言工作——同一个声音能够合成普通话、日语、韩语以及其他语言的语音。所有代码、权重和训练数据均在 Apache-2.0 许可下开源。

OmniVoice 采用简化架构,使用单个双向 Transformer,直接将文本映射到离散的声学标记,从而在 PyTorch 中实现比实时快 40 倍的推理速度。该模型在来自 50 个开源数据集的 580,000 小时音频上进行训练。在对 24 种测试语言的评估中,OmniVoice 在语音相似度和可懂度方面优于商业系统;在 102 种语言中,它与人类录音相当或表现更好。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

TCV 领投 $160M Corgi 保险初创公司的 B 轮融资

Corgi,这家总部位于美国的企业保险初创公司,于 5 月 6 日宣布已完成由 TCV 领投的 B 轮融资,融资额为 1.6 亿美元,估值为 13 亿美元(据 TechCrunch)。本轮融资还包括 Kindred Ventures、Leblon Capital 和 First Order Fund。这使 Corgi 的累计融资额达到 2.68 亿

Crypto Frontier7小时前

B.AI 在 5 月 7 日用户数突破 170 万,并推出奖励计划

据 B.AI 称,AI 基础设施平台在 5 月 7 日用户数突破 170 万。该平台聚焦隐私保护和代理经济基础设施,向新用户注册即提供 50 万个免费积分,并在所有模型上实行零加价定价,同时推出限时 1:1,

GateNews8小时前

Osome 削减 70+ 个岗位,并通过 AI 转型将 EBITDA 提升 50%

据 Tech in Asia 称,总部位于新加坡的企业管理平台 Osome 在过去两年中裁减了 70 多个岗位,同时部署 AI 来处理合规任务,例如记录交易和处理发票。首席执行官 Eugenio Ferrante 表示,公司将营收增长放缓了,i

GateNews11小时前

施耐德电气今年将在马来西亚开放东南亚培训中心,AI 工具将能耗降低 2%-3%

据路透社报道,施耐德电气计划今年在马来西亚开设一个面向东南亚的培训中心,以应对该地区因 AI 基础设施扩张带来的电力需求上升。该中心将培训合作伙伴和客户,内容涵盖能源管理系统和数据中心设备。施耐德'

GateNews11小时前

Hut 8 签 98 亿美元 AI 数据中心 15 年长约、股价盘前飙 36%

Hut 8 宣布与德州 Beacon Point 签署 1GW AI 数据中心首期 352MW 租约,期限 15 年、基期 98 亿美元,包含 3% 年增及三次 5 年续约选项;若全部执行,合约金额可达约 251 亿美元。承租方为高投资等等级客户,名称尚未公开。此案显示 Hut 8 正从矿业转型为 AI 基础建设商;Beacon Point 采用 NVIDIA DSX 架构,初期 352MW,预计 2027 年 Q1 通电、Q3 首期厂房交付,园区具 1GW 扩展能力。

鏈新聞abmedia20小时前

Core Scientific 以 4.21 亿美元收购比特币矿企 Polaris,并扩展 AI 数据中心业务

据 The Block 称,Core Scientific 于今天(5 月 6 日)以约 4.21 亿美元收购 Polaris DS LLC,获得一份 440 兆瓦的电力合同,并与 Oklahoma Gas & Electric 达成协议,以扩展其 AI 及高性能计算托管业务。Polaris 设施位于俄克拉荷马州,

GateNews21小时前
评论
0/400
暂无评论