微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌
(相关资料图)
微软近日推出了一款名为NaturalSpeech2的语音模型,该模型采用“潜在扩散”式设计,其在零样本语音合成层面的效果显著。微软表示,该模型提供了“商业级”的语音/歌唱解决方案,能够为用户提供高质量、多样化的语音合成体验。 微软对NaturalSpeech2进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。与传统的语音转文字(TTS)系统不同,NaturalSpeech2使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。 实验结果显示,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在LibriTTS和VCTK测试集上的自然度(以CMOS为度量)与真人语音难以区分。该项目的论文已经发布,感兴趣的人可以查阅。
关键词:
-
微软推出NaturalSpeech2语音模型:零样本生成唱歌唱歌
2023-07-28 -
国金证券:高能级城市政策的宽松空间更大 关注布局优质一二线城市央国企及改善型房企
2023-07-28 -
爆料被证实!日本央行“松绑”YCC,日本市场遭遇“股债双杀”
2023-07-28 -
关于唐古的介绍(唐古)
2023-07-28 -
“亲子啄木鸟”在行动!社区把关怀送到心坎上
2023-07-28 -
奥园健康按复牌指引完成调查并全面落实整改事项
2023-07-28 -
2023植物奶市场正红火 植物奶行业发展前景分析
2023-07-28 -
海南持续推动药品进口便利化 目前共备案进口药品290单
2023-07-28 -
大扩产能,高溢价收购关联企业,圣农发展肉鸡产能增加“一个小目标”
2023-07-28 -
东华软件:公司与华为在光伏行业没有落地项目
2023-07-28 -
现代汽车将在2019年法兰克福车展上展示一款电动概念车
2023-07-28 -
顺络电子:7月27日融券卖出金额40.91万元,占当日流出金额的0.58%
2023-07-28 -
龙之谷好看吗(龙之谷好玩的吗)
2023-07-28 -
皮海洲:科学合理保持IPO常态化应从三方面着手
2023-07-28 -
天宜上佳(688033):7月27日北向资金减持4.2万股
2023-07-28 -
东方甄选抖音“相爱相杀”
2023-07-28 -
新赛季是否接受替补角色?凯尔登:当然可以 我只想要赢球
2023-07-28 -
海螺水泥于张家港新设新型建材公司,注册资本3000万元
2023-07-28 -
微信摇一摇在哪里可以找到 微信摇一摇在哪里
2023-07-27 -
深圳直飞林芝航线开通暑运首月深圳机场新开加密航线近20条
2023-07-27 -
2023夏日空调消费趋势观察:高温带动消费“升温” 创新创造美好体验
2023-07-27 -
【台本】病娇蟑螂姐姐的霸爱(四爱/病娇/人外娘/男性向)
2023-07-27 -
坍塌之后,齐齐哈尔的全城送别
2023-07-27 -
雪的寓意和象征
2023-07-27 -
编造“武汉车祸身亡小学生母亲收钱”谣言者已被行拘
2023-07-27 -
月子期间不能看手机是吗 月子病下次坐月子能养好吗
2023-07-27 -
图一法兰克福跟队记者Christopher Mi...
2023-07-27 -
和政县滨河东区330kV临茨一线115#-122#改迁工程
2023-07-27 -
一个危险的信号悄然而至,美军退役上将呼吁,向俄黑海舰队开火
2023-07-27 -
新兴市场国家和发展中国家营商环境发展论坛在京举办
2023-07-27
-
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16 -
保持稳定发展有支撑——从11月“成绩单”看中国经济走势
2021-12-16