阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

DDD

发布时间：2025-09-23 14:41:46

1059人浏览过

来源于php中文网

原创

阿里通义qwen团队近日发布了其最新的旗舰级多语言、多音色文本转语音模型——qwen3-tts-flash。该模型不仅支持多种语言和音色输出，还覆盖了包括普通话及闽南语、吴语、粤语、四川话、北京话、南京话、天津话、陕西话在内的9种汉语方言，展现出强大的语言适应能力。

在性能表现上，Qwen3-TTS-Flash已在seed-tts-eval与MiniMax多语测试集中展现出卓越的语音稳定性与音色相似度，达到当前最先进的SOTA水平。同时，官方已同步推出API接口、在线Demo以及多段音频样例，方便开发者和用户快速体验。

据团队介绍，Qwen3-TTS-Flash在语音质量和一致性方面经过全面评测，在多项关键指标上均优于现有主流模型。

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

在seed-tts-eval测试集上的评估显示，Qwen3-TTS-Flash在中文和英文的语音稳定性方面均取得了最佳表现，明显优于SeedTTS、MiniMax以及GPT-4o-Audio-Preview等模型。

此外，在MiniMax多语言TTS测试集上，Qwen3-TTS-Flash在中文、英文、意大利语和法语的词错误率（WER）上均达到最低水平，显著优于MiniMax、ElevenLabs和GPT-4o-Audio-Preview。在说话人相似度方面，其在英文、意大利语和法语上的得分也全面领先，充分体现了其在多语言场景下的高质量合成能力。

Copy Leaks

AI内容检测和分级，帮助创建和保护原创内容

下载

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

作为一款统一架构的旗舰级语音合成模型，Qwen3-TTS-Flash支持17种不同音色，每种音色均可生成10种语言的语音内容。除中文方言外，模型还支持英式、美式及其他地区口音的英语，并涵盖法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语和韩语等多种国际语言。

阿里通义发布旗舰语音合成模型 Qwen3-TTS-Flash

功能层面，Qwen3-TTS-Flash具备自动语气调节、强鲁棒性的文本预处理机制以及跨语种混合生成能力，能够应对复杂多变的实际应用场景。在推理效率方面，该模型表现出色：单并发情况下首包延迟低至97ms，满并发时为420ms，实时因子（RTF）最低可达0.30，兼顾了高质与高效。

香港科技大学教授测试使用 AI 眼镜进行考试作弊

OpenAI 元老级研究员 Jerry Tworek 离职

全新代码大语言模型 IQuest-Coder 开源发布

手机版ChatGPT的「思考模式」不再是装饰用！更新后真的能给出比较完整的答案

《连线》杂志：2026 年将是阿里千问之年

相关标签:

gpt 多语言 gpt-4 qwen 架构接口并发 gpt 文本转语音

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：一机在手全球畅游：用鸿蒙5轻松玩转境外热门城市Top5 下一篇：马拉松“最快女护士”张水华发文道歉：未来必定更加专注于赛道

作者最新文章

央视影音怎么设置热键？-央视影音设置热键的方法

2026-01-15 16:52

玄戒芯片用久了会变卡吗

2026-01-15 16:53

如何在 Go 中安全地为阻塞操作设置超时并实现取消机制

2026-01-15 16:53

Go 中读取命名管道（FIFO）时 CPU 占用 100% 的原因与修复方案

2026-01-15 16:53

界面减负、体验加码:芒果TV用“加减法”重塑播放页！

2026-01-15 16:58

SQLite 中使用 RETURNING 子句获取插入行 ID 的完整指南

2026-01-15 17:00

消息称三星显示全球率先启动 8.6 代 OLED 生产线量产

2026-01-15 17:00

咪咕视频怎么设置显示剩余流量

2026-01-15 17:00

如何为菜单按钮动态激活对应彩色状态框（CSS变量 + data属性方案）

2026-01-15 17:01

新一代中端神U！联发科天玑8500发布：跑分突破240万、GPU性能大涨25%

2026-01-15 17:03

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1018

2023.10.19

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

405

2025.12.29

Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践，涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC（Unary/Server/Client/Bidirectional）、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例，帮助学习者掌握使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系，适用于微服务与内部系统通信场景。

2026.01.15

公务员递补名单公布时间公务员递补要求

公务员递补名单公布时间不固定，通常在面试前，由招录单位（如国家知识产权局、海关等）发布，依据是原入围考生放弃资格，会按笔试成绩从高到低递补，递补考生需按公告要求限时确认并提交材料，及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料（确认书、资格复审材料）并准时参加面试。

2026.01.15

公务员调剂条件 2026调剂公告时间

(一)符合拟调剂职位所要求的资格条件。 (二)公共科目笔试成绩同时达到拟调剂职位和原报考职位的合格分数线，且考试类别相同。拟调剂职位设置了专业科目笔试条件的，专业科目笔试成绩还须同时达到合格分数线，且考试类别相同。 (三)未进入原报考职位面试人员名单。

2026.01.15

国考成绩查询入口国考分数公布时间2026

笔试成绩查询入口已开通，考生可登录国家公务员局中央机关及其直属机构2026年度考试录用公务员专题网站http://bm.scs.gov.cn/pp/gkweb/core/web/ui/business/examResult/written_result.html，查询笔试成绩和合格分数线，点击“笔试成绩查询”按钮，凭借身份证及准考证进行查询。

2026.01.15