微软推出语音合成模型NaturalSpeech2

AI行业动态1年前 (2023)发布 ainavi

9,996 0 800

微软日前推出语音合成模型NaturalSpeech2，该模型采用潜在扩散式设计，可提供“商业级”语音/歌唱解决方案。在零样本情况下，该模型可以生成具有不同说话人身份、韵律和风格（如唱歌）的语音的能力。且其在零样本条件下生成的语音与语音提示，和真实语音的韵律近乎一致，并在LibriTTS和VCTK测试集上的自然度（以CMOS为度量）与真人语音难以区分。

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

英国监管机构要求对亚马逊和微软的云计算主导地位进行反垄断调查

ainavi

9,992 800

首个华人“菲尔兹奖”得主丘成桐：数学家不会被人工智能取代

ainavi

10,260 800

DeepMind联创：五年内人人都将拥有AI助手

ainavi

8,120 1600

奥特曼正式回归OpenAI 微软“如愿”进入OpenAI董事会：获得无投票权观察员席位

ainavi

9,428 3200

低成本快速定制大模型，这次我们来深度探讨下RAG 和向量数据库

ainavi

10,024 1200

大模型时代还不理解自注意力？这篇文章教你从头写代码实现

ainavi

8,208 3600

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号