通义大模型微信公众号正式发布全新一代端到端语音交互模型——fun-audio-chat。“不止于‘会说话’,更懂你言外之意、识你情绪起伏、助你高效办事——这才是真正懂你的ai语音伙伴。”
当前已开源 Fun-Audio-Chat 8B 版本,完整提供模型权重、推理代码及 Function Call 集成示例。

核心技术亮点:
高共情:如知己般自然流畅的对话体验
强实用:不止能聊,更能“上手就干”
实测表明,Fun-Audio-Chat 8B 在 OpenAudioBench、MMAU、Speech-ACEBench、VStyle 等多项主流语音多模态评测中,均在同参数量级模型中位列榜首,综合能力全面领先 GLM4-Voice、Kimi-Audio、Baichuan-Omni。
源码获取地址:点击下载
以上就是阿里开源端到端语音交互模型 Fun-Audio-Chat的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号