讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

阿里通义开源 Qwen3-ASR-Toolkit，音视频转录 Python 命令行工具

碧海醫心

发布： 2025-09-23 20:25:01

原创

585人浏览过

阿里通义开源 qwen3-asr-toolkit，音视频转录 python 命令行工具

阿里通义Qwen团队近日发布了一款开源的Python命令行工具——Qwen3-ASR-Toolkit，旨在突破Qwen3-ASR-Flash API对音频时长限制在3分钟内的瓶颈，支持对小时级音视频内容进行高效转录。

作为通义千问系列最新推出的语音识别模型，Qwen3-ASR-Flash依托强大的Qwen3基座模型，结合海量多模态数据及高达千万小时级别的ASR训练数据，具备卓越的语音理解能力。

新推出的Qwen3-ASR-Toolkit集成了VAD（Voice Activity Detection）智能静音检测与切分技术，在精准分割音频的同时保障语义句子的完整性；工具可自动将任意采样率的输入音频转换为16 kHz单声道格式，适配模型输入要求；并通过多线程并发上传音频片段，大幅提升整体处理速度。

该工具基于FFmpeg构建，广泛兼容多种媒体格式，包括mp4、mov、mkv、mp3、wav、m4a等，几乎覆盖主流音视频文件类型。

Icons8 Background Remover

Icons8 Background Remover

Icons8出品的免费图片背景移除工具

Icons8 Background Remover

31

Icons8 Background Remover

立即学习“Python免费学习笔记（深入）”；

项目已完全开源，地址：https://www.php.cn/link/51e706f8b33d4020dbe481ae37603842

以上就是阿里通义开源 Qwen3-ASR-Toolkit，音视频转录 Python 命令行工具的详细内容，更多请关注php中文网其它相关文章！

相关标签：

python git github 工具通义千问 qwen Python 线程多线程并发 github https ffmpeg

大家都在看：

Python 软件基金会拒绝美国政府拨款后，引发社区“捐赠潮” 月之暗面发布 LLM 抽象层开源框架“Kosong” 百度网盘发布 MCP 服务器揭秘 MiniMax M2 Agent 能力技术细节：Interleaved Thinking（交错思维链） JetBrains 调研：2025 年最受欢迎的 Python 框架和库

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：陈天桥重出江湖？打造了"全球顶尖的预测型大模型"MiroMind 下一篇：Omni-Infer v0.5.0 发布，超大规模 MoE 模型推理加速技术

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

老任太不人性化了！《小小书店》因1个词遭下架Switch商店

2025-12-18 12:23:20
《UNDERWARD》登陆Switch 2 好评合作恐怖探索

2025-12-18 12:30:38
微星PRO A1000PL PCIE5电源上市：ATX3.1+PCIe5.1双认证，首发699元

2025-12-18 12:30:54
制作人透露《星露谷物语》1.7版本将大幅扩展社交玩法

2025-12-18 12:43:14
这些黑人游戏角色强到爆炸手撕坦克、单挑神魔!

2025-12-18 12:45:13
凝练精致！《影之刃零》将学习《33号远征队》精简游戏内容

2025-12-18 13:31:02
真实到像是现实？被逼自证的FPS活了!官方：钱已到位

2025-12-18 13:31:12
鉴于《地平线6》开发要求:《极限竞速8》将停更

2025-12-18 13:40:03
与徕卡合作升级小米17 Ultra官宣！博主称小米也要有自己的非凡大师：堆料远超友商

2025-12-18 13:41:01
《光与影：33号远征队》确认在开发过程中也使用了生成式AI

2025-12-18 13:44:03

最新问题

Meta：不限制员工使用 Gemini 和 GPT 等三方 AI 模型据BusinessInsider报道，Meta正在放宽内部限制，扩大员工对Google、OpenAI等竞品AI工具的使用权限。内部文件及公司内部通讯显示，Meta正大力推动将人工智能工具深度融入日常工作的各个环节，并全面推行“AI优先”战略。目前，Meta员工已被授权接入并使用包括Google的Gemini3Pro、OpenAI的GPT-5在内的多个第三方大模型，以提升工作效率。与此同时，Meta已将其核心办公套件迁移至GoogleWorkspace，旨在“释放

2025-12-18 18:50:04

177

腾讯回应 “元宝” 身份质疑：一个完全由 AI 生成内容的助手腾讯旗下AI助手“元宝”近日引发用户广泛讨论，不少人在互动中反复追问：“你到底是AI还是人？”对此，腾讯官方正式回应，明确指出元宝是一款完全基于人工智能技术构建的助手，所有内容均由模型自主生成，全程无人工干预或后台润色。根据官方说明，元宝被定位为具备高感知力与高情商的智能体，不仅能高效理解语义，还能兼顾语气、分寸与情感表达，从而实现自然流畅的对话体验。正因回复质量接近甚至超越部分真人水平，反而触发了用户的“真实性怀疑”——有人调侃式发问：“元宝你回尿床吗？”元宝仅以一个“？”作答；也有人试探性别

2025-12-18 18:49:14

151

OpenAI 开放 ChatGPT 第三方应用提交通道 OpenAI正式启用第三方应用入驻ChatGPT的提交通道，面向全球开发者开放。经平台审核通过后，基于OpenAI模型开发的工具可直接集成至ChatGPT，无需用户手动下载或安装。该机制融合自动化检测与人工复核流程，审核达标的应用将原生嵌入ChatGPT界面，实现“即点即用”。当前重点招募方向涵盖生产力增强类、学术研究支持类、创意生成辅助类及垂直行业智能体等应用场景，致力于构建以自然语言对话为交互核心的AI应用生态体系。在ChatGPT的“应用（BETA）”专区中，OpenAI已

2025-12-18 18:49:02

743

索尼诉腾讯《荒野起源》侵权案达成和解，长达半年的游戏官司终于画上句号感谢网友guser的线索提供！12月18日，美国加州北区联邦地方法院发布的一份官方文件，为本年度全球游戏行业最受瞩目的跨国知识产权纠纷划上了终止符。公开信息显示，索尼已正式向法院提交撤诉申请，终结其针对腾讯旗下新作《荒野起源》所发起的侵权诉讼。目前，双方已达成具有法律约束力的保密和解协议，约定不再就本案发表任何公开声明，并表达了对未来深化协作的积极意愿。从今年7月硝烟弥漫的司法对抗，到12月悄然落幕的庭外握手，这场风波在短短五个月内完成了由法律攻防到商业关系重构的关键跃迁。置于全球游戏产业演进的

2025-12-18 18:32:07

148

xAI 发布 Grok Voice Agent API xAI正式推出GrokVoiceAgentAPI，面向全球开发者开放其已在Tesla汽车及官方移动应用中实际部署并验证的语音智能代理技术。据悉，该API覆盖数十种主流语言，支持实时工具调用与联网搜索功能，端到端首音频响应平均耗时低于1秒，并在BigBenchAudio权威语音评测中荣登榜首。GrokVoiceAgent基于xAI自研的全栈语音技术构建，涵盖语音活动检测（VAD）、专用分词器及高性能音频理解模型，按使用时长计费，单价为每分钟0.05美元。API全面兼容OpenAIRealti

2025-12-18 18:19:03

731

何小鹏：当前没有 AI 泡沫，未来市场有巨大机遇小鹏汽车董事长何小鹏近日在朋友圈分享了自己对当前AI领域若干关键议题的深度思考，涵盖AI泡沫、物理AI、美国新兴创业生态与机器人发展，以及通用人工智能（AGI）的演进路径等热点话题。谈及近期热议的“AI泡沫”现象，何小鹏指出，回顾历次技术革命——从互联网到新能源汽车，每个科技周期中都不可避免地存在阶段性或局部性的估值过热。但这种表象实则是市场由混沌走向有序的必经竞争阶段。他强调，AI对社会整体的重塑力毋庸置疑，而当下仍处于0到0.1的极早期。若非要比较泡沫程度，他认为中国市场的估值相对稳健务实，

2025-12-18 18:15:07

411

工信部电子信息司：以市场化法制化手段推动光伏落后产能退出 12月18日，2025光伏行业年度大会在京举行。工业和信息化部电子信息司司长杨旭东在会上指出，在高技术产业中，光伏是少有的实现从上游材料、中游制造到下游应用全链条全球领先的领域，已成为“中国制造”走向世界的一张闪亮名片。值得注意的是，我国光伏产业的发展历程并非一帆风顺，而是历经了四次快速扩张与三次深度调整，目前正步入新一轮结构性变革的关键阶段。杨旭东表示，2026年是“十五五”规划的起步之年，也是行业发展承压前行、爬坡过坎的重要一年。行业治理已进入深水区和攻坚期。工信部电子信息司将联合相关部门持

2025-12-18 17:21:06

403

英伟达就前员工窃取老东家智能驾驶机密案与法雷奥达成和解 12月18日快讯，据彭博社最新报道，英伟达已就前雇员MohammadMoniruzzaman在离职法雷奥前非法获取其智能驾驶领域商业机密一事，与法雷奥正式达成和解。该工程师于2021年自法雷奥加入英伟达。此后，在一次由梅赛德斯-奔驰牵头、双方共同参与的技术协作视频会议中，一名法雷奥员工敏锐察觉到其共享屏幕上赫然出现了法雷奥内部源代码文件，随即启动调查并提起法律程序。法雷奥主张，英伟达实际受益于此次窃密行为；而英伟达回应称，其未将涉事数据用于停车辅助技术的研发，并在确认情况后迅速解除Moniruz

2025-12-18 17:07:02

271

商务部：强烈反对欧委会密集对多家中国企业发起调查 12月18日最新消息，据新华社报道，商务部新闻发言人何亚东在当日举行的例行新闻发布会上指出，中方高度关注欧盟委员会近期频繁依据《外国补贴条例》（FSR）对中国企业展开调查，已先后对中车集团、同方威视启动深度审查，并突击检查中国本土数字平台在欧运营实体，相关行动手段粗暴，目标明确、区别对待特征突出，严重违背公平原则。商务部强调，中方对此类针对性极强的执法行为表示坚决反对。敦促欧方立即叫停针对中国企业的无端施压，切实规范FSR工具的适用边界，避免将其异化为排他性政策武器；同时应切实履行承诺，为包括中

2025-12-18 17:02:00

919

火山引擎总裁谭待：大模型市场不是零和博弈，明年市场可能还要再涨十倍感谢网友啊俊的线索投递！12月18日消息，今日，火山引擎在FORCE原动力大会期间，当被问及豆包大模型2025年整体表现时，火山引擎总裁谭待回应称：整体成果令人满意，在国内市场优势尤为突出；但放眼全球，OpenAI与Gemini等头部模型依然实力强劲，我们仍需持续精进。值得肯定的是，火山引擎自研的Seedance视频生成系列与Seedream图像创作系列已在国际市场上展现出不俗竞争力。针对2026年大模型产业格局，谭待强调：当前首要任务并非彼此争夺份额，而是合力拓展整个市场空间

2025-12-18 17:01:02

304

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新Python教程从入门到精通

5211次学习
收藏
Django 教程

21982次学习
收藏
SciPy 教程

8248次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部