讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

智谱上线并开源工业级语音合成系统 GLM‑TTS

碧海醫心

发布： 2025-12-12 17:32:19

原创

274人浏览过

智谱ai正式发布并开源了工业级语音合成系统 glm‑tts。

官方介绍显示，仅需3秒的语音片段，GLM‑TTS 即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中，均可输出自然连贯、高度拟人化的语音效果。

GLM‑TTS 采用两阶段语音生成架构，并在训练过程中融合基于 GRPO 的强化学习策略，在公开基准测试的「字错误率（CER）」与「情感表达准确度」两项关键指标上，均达到当前开源模型中的最优水平（SOTA）。

智谱上线并开源工业级语音合成系统 GLM‑TTS

智谱上线并开源工业级语音合成系统 GLM‑TTS

该模型基于 GRPO 框架，设计了多维度奖励函数与稳定性增强机制，在确保可控性的前提下，显著提升了语音的表现力与鲁棒性。

智谱上线并开源工业级语音合成系统 GLM‑TTS

其强化学习模块创新性地结合真实训练数据与高质量合成数据构建训练样本，实现了近乎零成本的数据扩充。通过与优化后的训练算法深度协同，有效抑制了奖励欺骗（reward hacking）现象，保障了模型性能的真实性与泛化能力，即便面对未参与训练的新样本，依然保持优异表现。

Ghiblio

Ghiblio

专业AI吉卜力风格转换平台，将生活照变身吉卜力风格照

Ghiblio

157

Ghiblio

值得关注的是，GLM‑TTS 仅依赖约10万小时的训练数据，远低于主流商用语音合成模型所需的数据量。同时，它在训练效率与效果之间取得良好平衡：预训练阶段仅需单台服务器运行4天，即可达成开源领域领先的“发音准确率”与“音色保真度”；而针对精品音色微调的 LoRA 模块及后续强化学习精调，也仅需单机1天即可完成，大幅优于行业平均耗时。

智谱上线并开源工业级语音合成系统 GLM‑TTS

此外，GLM‑TTS 在成本大幅降低的同时，仍斩获业内顶尖的 MOS 分数（Mean Opinion Score，平均主观评分），展现出卓越的听感品质。

GLM‑TTS 相关资源（含模型权重、推理代码、示例工程等）：

GitHub：https://www.php.cn/link/bc931d478676400884a7371ff4b9b0f5
Hugging Face：https://www.php.cn/link/23270334cb68c628783066181ece864b

源码地址：点击下载

以上就是智谱上线并开源工业级语音合成系统 GLM‑TTS的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git github ai 架构 github 算法 https 语音生成

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：全国集成电路标准化技术委员会 IP 核工作组成立下一篇：通义千问保持 AI 模型领先地位，阿里云 CTO 周靖人晋升阿里合伙人

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《刺客信条：影》风格的双主角设定未来可能会延续

2025-12-12 18:55:40
PHP API数据处理：高效遍历并显示JSON响应中的所有指定字段

2025-12-12 19:00:08
笔记本越用越卡：原因可能在内存

2025-12-12 19:01:34
TGA 2025：《毁灭战士：黑暗时代》赢得无障碍创新奖

2025-12-12 19:03:34
鸿蒙智行创中国新势力最快百万交付纪录，问界M9贡献超四分之一销量

2025-12-12 19:10:08
《微软飞行模拟2024》想登PS5曾被拒绝索尼主动联系微软高层促成移植

2025-12-12 19:11:15
在PHP应用中正确获取.htaccess定义的服务器环境变量

2025-12-12 19:12:08
NextUI Navbar 背景颜色自定义教程：掌握两种高效方法

2025-12-12 19:15:25
深入理解Java方法返回类型：从基本数据到对象

2025-12-12 19:17:07
Safari iOS 16下z-index失效问题解析与解决方案

2025-12-12 19:25:17

最新问题

Linux 基金会宣布成立 Agentic AI 基金会 Linux基金会正式宣布成立AgenticAI基金会（AAIF），该基金会致力于构建一个中立、开放的协作平台，推动AgenticAI技术以透明、可信且共建共享的方式持续演进。目前，亚马逊AWS、Anthropic、Block、彭博社、Cloudflare、谷歌、微软与OpenAI已确认成为AAIF的白金级会员。首批纳入AAIF的开源项目涵盖多个前沿实践：Anthropic提出的模型上下文协议（MCP）、Block推出的goose框架，以及OpenAI发布的AGEN

2025-12-12 19:35:45

251

苹果和谷歌联手合作，简化 iPhone 与 Android 双向迁移数据流程据科技媒体9to5Google报道，谷歌与苹果联合打造的“跨平台换机工具”已初现端倪，其早期形态已集成于最新发布的AndroidCanary开发者预览版中，并有望在即将推出的iOS26开发者测试版中同步上线。过去，Android与iOS用户在切换操作系统时，往往需借助第三方迁移应用，或分别使用苹果官方的“转移到iOS”与谷歌提供的“SwitchtoAndroid”等独立工具。尽管这些方案支持基础数据（如通讯录、相册、日历）的转移，但在迁移范围、操作流畅度以及跨系统兼容性方面仍显

2025-12-12 19:23:50

781

中兴通讯：公司反对一切腐败行为，正与美国司法部就有关事项进行沟通感谢网友某咸鱼的小号、小星_14、会弹琴的九号、啊俊的线索提供！12月11日消息，中兴通讯股份有限公司当日发布一则重大事项公告，明确指出：公司坚决抵制任何形式的腐败行为，当前正就相关事宜与美国司法部保持沟通。公告全文如下：中兴通讯股份有限公司（以下简称“公司”）董事会已关注到近期媒体关于公司可能涉及美国《反海外腐败法》合规性调查的报道。公司正与美国司法部就此事进行积极沟通，并将依法依规采取一切必要措施，坚定捍卫自身合法权益。公司持续深入推进合规管理体系建设，全力构建具备行业标杆水准的合规治理

2025-12-12 19:22:20

869

京东：未来 5 年投 220 亿，新供应 15 万套“小哥之家” 感谢网友啊俊的线索提供！12月12日消息，京东今日正式对外宣布：未来五年内将斥资220亿元，通过租赁、自建及住房保障基金支持等多种渠道，建设并运营共计15万套“小哥之家”，预计将覆盖并惠及不少于20万名一线员工，持续提升快递员、外卖骑手等基层劳动者的居住品质。与此同时，京东还将同步升级一线员工的福利体系与职业技能培训机制。京东透露，随着最新一批全职骑手顺利入住位于北京通州区的“京东小哥之家”，目前京东已为一线员工累计提供住房达2.8万套，服务范围遍及全国145座城市。据京东介

2025-12-12 19:20:02

333

摩尔线程科创板上市股价暴涨 723%，官方提示新产品量产仍需时日感谢网友啊俊、某咸鱼的小号的线索提供！12月11日消息，摩尔线程今日发布股票交易风险提示公告。公告指出，公司已于2025年12月5日正式登陆上海证券交易所科创板。截至2025年12月11日，公司股票收盘价较发行价累计上涨723.49%，涨幅明显偏高。该涨幅显著超出科创综指、科创50等主要科创类指数同期表现。据公告披露，2025年前三季度，摩尔线程实现营业收入7.85亿元，归属于母公司所有者的净利润为-7.24亿元。公司预计2025全年归属于母公司股东的净

2025-12-12 19:01:57

507

阿里通义实验室开源 Qwen-Image-i2L 阿里通义实验室正式发布Qwen-Image-i2L，支持将任意单张图像即时转换为可训练、可迁移的LoRA（Low-RankAdaptation）模型。无需依赖大规模图像数据集或高性能计算设备，用户仅需上传一张图片，系统即可自动生成轻量级LoRA适配模块，并可直接嵌入主流生成式AI模型中，快速实现“一图定风格”的高效迁移效果。Qwen-Image-i2L的技术核心在于其创新的图像语义解耦架构。该模型融合SigLIP2、DINOv3与Qwen-VL等先进多模态编码器，对输入图像进行深度解析，自动

2025-12-12 18:56:18

975

马斯克：希望下个月毫无保留地开源 X 平台全部代码 12月6日消息，北京时间今日凌晨，马斯克在X平台发布动态表示，X平台在向用户推送“令人着迷的内容”方面正快速推进，预计下个月即可全面开源X的全部源代码，做到彻底公开、不留保留。该表态系对科技博主RobertScoble一条长帖的回应。原帖核心内容整理如下：X平台的整体氛围正在悄然转变。我近期与xAI团队内部成员有过交流。据透露，全新升级的“完整版”推荐算法预计还需数周时间正式上线，将由新一代Grok模型驱动。而下面这份观察报告，让我对X的未来充满期待。随着新系统分阶段部署，平台生态已开始显现变化

2025-12-12 18:37:02

136

奶牛快传暂缓停服，正与 123 云盘洽谈战略合作感谢网友_ZeB、咩咩洋的线索提供！12月9日最新消息，奶牛快传于今日发布服务调整进展公告，表示在原定停服公告发布后，收到大量用户积极反馈与支持，经综合评估，决定暂缓原计划于12月8日启动的关停流程，并已正式与123云盘启动战略合作洽谈。谈判期间，奶牛快传所有功能（包括上传、下载、分享、登录等）将持续稳定运行，用户数据安全完整，现有使用体验不受任何影响。本次合作聚焦资源整合与能力互补，致力于为用户提供更可靠、更高效、更易用的云传输与存储服务体验。奶牛快传承诺将第一时间向公众同步合作进展及后续具体

2025-12-12 18:32:43

307

Meta 收购 AI 可穿戴初创公司 Limitless Meta近日正式宣布收购专注于人工智能可穿戴技术的初创公司Limitless。该公司以推出支持自然语音交互的智能吊坠（Pendant）而广受关注，其背后投资者阵容强大，涵盖知名风投机构AndreessenHorowitz以及OpenAI首席执行官SamAltman。Limitless的核心设备具备实时音频采集、高精度语音转文字及语义级语音搜索能力，核心定位是增强用户的注意力管理与长期记忆辅助。交易完成后，Limitless全体团队将并入Meta，深度参与下一代AI硬件的研发工作

2025-12-12 18:27:53

451

张亚勤院士：基础大模型最终不超过 10 个，十年后机器人比人多从ChatGPT到DeepSeek，AI正沿着“智能+”的路径进入新一轮浪潮。正值大模型从“算力堆叠”走向“推理优先”的关键节点，清华大学智能产业研究院（AIR）创始院长、中国工程院外籍院士张亚勤提出：新一轮人工智能，是信息智能、物理智能和生物智能的融合，本质上也是原子、分子和比特的融合。也就是说，在规模定律持续发挥作用的前提下，当参数规模、数据体量与算力资源跨过某个阈值，智能就不再只停留在模式识别，而是开始“涌现”——先是从鉴别式AI走向生成式AI，再从生成式AI走向以智能体为代表

2025-12-12 18:25:57

903

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

18846次学习
收藏
Git版本控制工具

14649次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部