首页 > 新闻 > IT新闻 > 正文

阿里通义开源 Qwen3-ASR-Toolkit,音视频转录 Python 命令行工具

碧海醫心
发布: 2025-09-23 20:25:01
原创
557人浏览过

阿里通义开源 qwen3-asr-toolkit,音视频转录 python 命令行工具

阿里通义Qwen团队近日发布了一款开源的Python命令行工具——Qwen3-ASR-Toolkit,旨在突破Qwen3-ASR-Flash API对音频时长限制在3分钟内的瓶颈,支持对小时级音视频内容进行高效转录。

作为通义千问系列最新推出的语音识别模型,Qwen3-ASR-Flash依托强大的Qwen3基座模型,结合海量多模态数据及高达千万小时级别的ASR训练数据,具备卓越的语音理解能力。

新推出的Qwen3-ASR-Toolkit集成了VAD(Voice Activity Detection)智能静音检测与切分技术,在精准分割音频的同时保障语义句子的完整性;工具可自动将任意采样率的输入音频转换为16 kHz单声道格式,适配模型输入要求;并通过多线程并发上传音频片段,大幅提升整体处理速度。

通义视频
通义视频

通义万相AI视频生成工具

通义视频70
查看详情 通义视频

该工具基于FFmpeg构建,广泛兼容多种媒体格式,包括mp4、mov、mkv、mp3、wav、m4a等,几乎覆盖主流音视频文件类型。

立即学习Python免费学习笔记(深入)”;

项目已完全开源,地址:https://www.php.cn/link/51e706f8b33d4020dbe481ae37603842

以上就是阿里通义开源 Qwen3-ASR-Toolkit,音视频转录 Python 命令行工具的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号