首页 > 新闻 > IT新闻 > 正文

阿里通义实验室发布端到端语音识别大模型 FunAudio-ASR

聖光之護
发布: 2025-09-16 18:16:14
原创
837人浏览过

阿里巴巴通义实验室推出了全新的端到端语音识别大模型 funaudio-asr。该模型引入创新的 context 模块,显著提升了在高噪声环境下的识别稳定性,将幻觉率从 78.5% 大幅下降至 10.7%,降幅接近 70%。

FunAudio-ASR 基于数千万小时的真实音频数据训练而成,并深度融合了大语言模型的语义理解能力,在远场、嘈杂背景及多说话人等复杂场景中表现出色,性能超越 Seed-ASR、KimiAudio-8B 等当前主流系统。

阿里通义实验室发布端到端语音识别大模型 FunAudio-ASR

为满足不同应用场景需求,团队还推出了轻量版模型 FunAudio-ASR-nano。该版本在保证较高识别精度的同时,大幅降低计算资源消耗,适用于对算力和成本敏感的终端部署场景。

通义听悟
通义听悟

阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。

通义听悟 85
查看详情 通义听悟

两个版本均支持低延迟流式语音识别、中英文自动切换以及用户自定义热词功能,具备良好的实用性与灵活性。目前,该技术已成功应用于钉钉“AI 听记”、视频会议系统以及 DingTalk A1 硬件设备中。其开放 API 也已在阿里云百炼平台正式上线,供开发者调用。

体验地址:https://www.php.cn/link/1a79e60cce2641f20b34acb72cd287d7
技术报告:https://www.php.cn/link/e340862bc3c1549012646f7abdc2e155

以上就是阿里通义实验室发布端到端语音识别大模型 FunAudio-ASR的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号