微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 新闻 > IT新闻 > 正文

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

聖光之護

发布： 2025-09-24 14:31:42

原创

271人浏览过

阿里通义qwen团队近日发布全新力作——qwen3-livetranslate-flash，这是一款基于大语言模型的高性能多语言实时音视频同声传译模型，具备高精度、低延迟与强鲁棒性的核心优势。

依托于Qwen3-Omni强大的基础模型能力，结合海量多模态数据及百万小时级音视频训练资源，Qwen3-LiveTranslate-Flash 成功实现了对18种主流语言的离线与实时双模式音视频翻译支持。

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

关键特性

广泛语言覆盖：支持中文、英文、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语、印尼语、泰语、越南语、阿拉伯语、印地语、希腊语、土耳其语等国际通用语言，并涵盖普通话、粤语、北京话、吴语、四川话、天津话等多种方言翻译。
视觉上下文融合：首次引入视觉增强机制，使模型不仅“听清”语音内容，更能“看懂”画面信息。通过识别口型、手势、场景文字及物体等视觉线索，有效提升在噪声干扰和歧义词汇场景下的翻译准确率。
极速响应仅3秒：采用轻量化的混合专家架构（MoE）与动态采样策略，实现端到端最低3秒的超低延迟同传体验，接近人类口语交互节奏。
高质量无损翻译：运用语义单元预测技术，优化跨语言生成中的语序调整问题，翻译结果贴近原文语义，质量媲美离线翻译系统。
自然拟人化语音输出：基于大规模真实语音数据训练，可自适应还原原声语气、情感与表达风格，输出音色逼真、富有表现力。

性能表现

在公开中英及多语种语音翻译测试集上，Qwen3-LiveTranslate-Flash 的整体准确率显著超越当前主流模型，包括 Gemini-2.5-Flash、GPT-4o-Audio-Preview 和 Voxtral Small-24B 等。

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

百灵大模型

百灵大模型

蚂蚁集团自研的多模态AI大模型系列

百灵大模型

177

百灵大模型

无论是在会议、访谈、教育还是影视等多样化应用场景下，Qwen3-LiveTranslate-Flash 均展现出稳定领先的翻译能力，尤其在复杂声学环境和专业领域中表现突出。

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

面对背景噪音、同音异义词、专有名词识别等挑战性场景，该模型凭借多模态协同理解能力实现更精准翻译。在实时模式下，视觉信息的引入显著弥补了音频断续或模糊带来的上下文缺失问题，优势尤为明显。

Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型

以上就是Qwen3-LiveTranslate 发布：视、听、说全模态同传大模型的详细内容，更多请关注php中文网其它相关文章！

相关标签：

gpt 多语言 gpt-4 大模型 gemini qwen 架构 gpt

大家都在看：

OpenAI CEO山姆・奥特曼宣布“GPT-6”将更名为“GPT-6-7” OpenAI 奥尔特曼宣布 GPT-6 将“更名为 GPT-6-7” OpenAI 发布开源安全模型 gpt-oss-safeguard Vercel CEO：Kimi K2 在智能体场景比 GPT-5 准确率高 50% OpenAI GPT-5 被指数学成就夸大

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：周鸿祎称不用AI的员工有理由裁掉 “对不起不是我裁掉你是AI时代裁掉你” 下一篇：“腾讯混元”上线小程序版本

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

PHP中不使用eval()安全计算数学表达式：基于调度场算法的实现

2025-11-16 12:33:02
Scrapy CSS选择器失效：理解Scrapy如何处理网页及验证响应内容

2025-11-16 12:38:02
Pandas pivot_table 高级技巧：优化列名与时间序列排序

2025-11-16 12:46:33
Go Struct嵌入与mgo持久化：实现BSON文档的扁平化存储

2025-11-16 12:46:45
React 中限制字符串显示的字数：截断过长文本并添加省略号

2025-11-16 12:52:36
Google Domains 域名列表程序化获取：API 现状与限制

2025-11-16 12:57:23
解决 Laravel 与 Mollie Webhook 集成失效问题

2025-11-16 12:57:32
Matplotlib Y轴标签字体大小调整实用指南

2025-11-16 12:57:46
Java中处理并展示多个重复元素的优化方法

2025-11-16 13:01:00
解决React中Fetch API的CORS授权头部问题

2025-11-16 13:02:18

最新问题

Qwen Code v0.2.1 发布，支持免费网络搜索 QwenCode是一款专为AI编程打造的命令行工具（CLI），基于GeminiCLI修改而来，针对Qwen3‑Coder系列模型强化了解析能力和工具生态支持。最新版本QwenCodev0.2.1正式上线，聚焦提升开发者体验与项目工程效率，带来多项关键功能升级。本次更新的核心亮点如下：免费网络搜索能力：支持多数据源检索，QwenOAuth用户每日可享受2000次免费调用额度；更精准的代码编辑：改进代码修改逻辑，引入模糊匹配机制以降低出错概率，显著减少重试次数；增强配置灵

2025-11-17 15:32:01

148

中国航发首次亮相迪拜航展，国产大飞机 C919 中东首秀感谢网友ZZB88088提供的资讯线索！11月17日消息，根据央视军事报道，2025年迪拜航展已于当地时间11月17日正式拉开帷幕。记者从中国航空发动机集团获悉，中国航发将首次亮相该展会，并展出多款备受瞩目的明星产品。此次参展是中国国产航空发动机在海外规模最大、展品最全、数量最多的一次集中展示，涵盖军用动力、民用动力及燃气轮机三大领域。展览共设5个展区，集中呈现19型先进动力装备。中国航发特别针对中东与非洲市场的实际需求，精心挑选并展示了适配当地应用场景的产品阵容。包括“太行”

2025-11-17 14:05:24

151

Kairoa v1.1.0 发布，跨平台桌面开发者工具 Kairoa是一款专为开发者设计的轻量级、易用且支持跨平台的桌面开发工具。版本详情版本号：v1.1.0本次更新亮点?新增功能模块Chmod权限计算器支持八进制与符号表示法进行文件权限计算提供可视化界面设置所有者、组及其他用户的读写执行权限实时生成并预览对应的chmod命令键盘事件信息查看器实时展示按键的key、code和keyCode等属性值显示当前修饰键状态（如Ctrl、Shift、Alt、Meta）支持一键将按键数据以JSON格式复制到剪贴板HTTPBasic认证编码工具快

2025-11-17 13:59:01

953

Spring Data 2025.1.0 GA SpringData2025.1正式版现已发布，本次更新涵盖多项重要升级与新特性：升级至SpringFramework7全面支持JakartaEE11（含JPA3.2、Servlet6.1）引入Ahead-of-TimeRepositories支持基于JSpecify实现完整的空值安全（nullsafety）新增对Jackson3的支持支持向量搜索方法（VectorSearchMethods）Ahead-of-TimeRepositories将AOT编

2025-11-17 13:30:13

445

Databricks 联创：美国必须转向开源模式才能在 AI 领域战胜中国 Databricks联合创始人AndyKonwinski在近期举行的CerebralValleyAI峰会上发出警示：美国正在逐渐丧失其在AI研究领域的领先地位，而中国正迅速填补这一空白。他指出，这种转变已不仅仅是技术竞争问题，更是对民主体制的“生存性威胁”。Konwinski引用来自伯克利和斯坦福大学博士生的观察称，过去一年中具有重要影响力的AI创新思路，大约有一半来自中国研究团队，这一比例远超以往任何时期。他与前NEA合伙人PeteSonsini、Antimatter首席执行官AndrewKr

2025-11-17 13:28:14

248

中国工程院院士邬贺铨：面向 6G 智能体终端，将孕育催生全新的操作系统 11月17日消息，2025年6G发展大会于11月13日在北京经济技术开发区拉开帷幕，本次大会以“智联全球，共建6G技术创新生态”为核心主题。在大会的6G主旨报告环节，中国工程院院士邬贺铨发表了题为“以终端创新为抓手建6G发展新生态”的专题演讲。他在演讲中强调，移动通信的代际演进往往体现在终端能力的提升上。当前在5G时代，智能手机依然是用户接入移动互联网的主要工具，也是推动移动经济发展的关键支柱。展望6G时代，消费类市场预计仍将是业务发展的主导力量，因此必须依靠全新的

2025-11-17 13:07:20

145

世界在建最大跨径公轨两用悬索桥首节钢桁梁吊装完成 11月16日，渝长高速复线连接道的关键工程——黄桷沱长江大桥成功完成首节钢桁梁的吊装作业，此举意味着大桥建设全面进入上部结构拼装时期，为主桥在2026年中期实现合龙打下了坚实的基础。黄桷沱长江大桥总长度达到1260米，主跨跨度为765米，属于单跨悬吊双塔三跨连续钢桁梁悬索桥类型，是当前全球正在建设的最大跨度的公轨两用悬索桥。该桥设计有双层桥面，上层布置了6车道的城市快速路，而下层中间部分规划为双向轨道交通预留空间，两边则设有4车道的城市主干道路。此次吊装的首段钢桁梁尺寸为宽36.5米、长22.5

2025-11-17 11:58:56

519

内存短缺引发科技行业恐慌性囤货，消息称华硕、微星等厂商大举备货 2025年第四季度，内存采购热潮不断升级，整个供应链陷入恐慌性抢购。据市场消息，华硕、微星等品牌厂商及系统供应商正大规模进行备货。有业内人士透露，大型云服务提供商（CSP）对高带宽存储器（HBM）和DDR5RDIMM模组的需求急剧上升，导致内存成为影响2026年产业布局的关键战略资源。目前，模组制造商与系统厂商已全面展开一场激烈的“囤货竞赛”。在需求强劲推动下，主要内存模组厂2025年第三季度财报创下历史新高。创见资讯（Transcend）2025年10月单月获利同比增长2.4倍，几乎相当于其第

2025-11-17 11:52:35

821

自行车也能上地铁，深圳部分线路试运行“轨道 + 骑行”服务 11月16日消息，11月15日起，深圳地铁在2/8号线、6号线及6号线支线正式启动周末骑行友好服务试点。试运行时间：每逢周末开展试运行试运行站点：2/8号线：后海站（E口）、福田站（3B、29、30B口）、梧桐山南站（C1口）、大梅沙站（A、B、C口）6号线、6号线支线：科学馆站（F口）、体育中心站（A1口）、红山站（B口）、光明站（A口、D口）、红花山站（D口）、光明城站（B口）据了解，乘客需确认所携带的自行车满足以下条件：为单座、人力驱动类型，且车轮直

2025-11-16 22:00:11

709

优必选、陕西电信合作的 10 万台 AI 悟空机器人已开启交付 11月16日消息，今年6月，中国电信陕西公司携手优必选科技共同推出了首款面向家庭桌面场景的AI人形机器人，并作为中国电信“美好家”产品线中的首个人形机器人正式亮相。据《证券时报》报道，这款名为“AI悟空”的“AI大模型驱动家庭小型人形机器人”目前已在陕西电信多个核心营业厅正式上线销售，标志着双方此前达成的“10万台销量目标”战略合作已迈入实际交付阶段。据悉，该项目自2024年7月启动研发，由陕西电信科技创新团队、数字生活公司联合优必选科技组建专项研发队伍，采用“省级公司+专

2025-11-16 19:07:02

126

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

C 语言教程

358345次学习
收藏
C语言进阶篇

81988次学习
收藏
Go语言教程手册

132451次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部