首页 > 新闻 > IT新闻 > 正文

小米 Kaldi 团队开源零样本语音合成模型模型 ZipVoice

霞舞
发布: 2025-09-11 20:28:01
原创
759人浏览过

小米 kaldi 团队开源零样本语音合成模型模型 zipvoice

近日,小米集团新一代 Kaldi 团队推出了基于 Flow Matching 框架的 ZipVoice 系列语音合成(TTS)模型,包括 ZipVoice(零样本单人语音合成模型)和 ZipVoice-Dialog(零样本对话语音合成模型)。

作为 zipformer 架构在语音生成领域的延伸与实践,ZipVoice 有效缓解了当前零样本语音合成模型普遍存在的模型参数庞大、推理速度缓慢等问题,在模型轻量化与生成效率方面实现了显著提升。而 ZipVoice-Dialog 则进一步攻克了对话式语音合成在输出稳定性与响应速度上的技术瓶颈,成功实现了高效、稳定且自然流畅的多轮语音对话生成。

目前,ZipVoice 系列模型的完整模型文件、训练与推理代码,以及包含 6.8k 小时对话语音的开源数据集 OpenDialog 已全部公开发布:https://www.php.cn/link/b21da80e55c4e85ed1270e4fafb702c2

可灵大模型
可灵大模型

可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型

可灵大模型214
查看详情 可灵大模型

ZipVoice 相关论文详见:https://www.php.cn/link/cf62365fe3fb1f6e44ca45af14daa212

语音合成效果演示可访问:https://www.php.cn/link/93f97410020f1aeb261aa376df54f44d

以上就是小米 Kaldi 团队开源零样本语音合成模型模型 ZipVoice的详细内容,更多请关注php中文网其它相关文章!

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号