讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验

舞夢輝影

发布时间：2025-11-10 10:09:22

|

992人浏览过

|

来源于php中文网

原创

stepfun ai 近日发布了其开源的音频编辑模型 step-audio-editx，这一创新的3b 参数模型将音频编辑的操作变得像文本编辑一样直接和可控。通过将音频信号的编辑任务转换为逐字的令牌操作，step-audio-editx 使得表达性的语音编辑变得更加简单。

目前，大多数零样本文本到语音（TTS）系统在情感、风格、口音和音色的控制上都显得有限。尽管它们可以生成自然的语音，但往往无法精确地符合用户的需求。过去的研究尝试通过额外的编码器和复杂的架构来拆分这些因素，而 Step-Audio-EditX 则通过调整数据和训练目标来实现控制。

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验 - php中文网

Step-Audio-EditX 采用了双代码本的标记器，将语音映射为两个令牌流，一个是以16.7Hz 的速率记录的语言流，另一个是以25Hz 的速率记录的语义流。模型在一个包含文本和音频令牌的混合语料库上进行了训练，使其能够同时处理文本和音频令牌。

该模型的关键在于采用大边距学习的方法，后续训练阶段利用合成的大边距三元组和四元组来增强模型的表现。通过使用约60000名说话者的高质量数据，模型在情感和风格编辑方面表现出色。此外，模型还利用人类评分和偏好数据进行强化学习，以提高语音生成的自然性和准确性。

360 AI助手

360 AI助手

360公司推出的AI聊天机器人聚合平台，集合了国内15家顶尖的AI大模型。

下载

StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验 - php中文网

为了评估模型的效果，研究团队引入了 Step-Audio-Edit-Test 基准，使用 Gemini2.5Pro 作为评判工具。测试结果显示，经过多轮编辑，模型在情感和说话风格的准确性上都显著提升。此外，Step-Audio-EditX 还可以有效提升其他闭源 TTS 系统的音频质量，为音频编辑的研究带来了新的可能性。

相关文章

Qwen Code 重磅更新：让 AI 编程跳出命令行

谷歌计划将其 Propeller 性能优化工具合并进 LLVM 主线

抖音能当微信公众号用：长图文功能上线，最多可发 8000 字，还能配乐

X 上线基于 Grok 模型的“AI 图片编辑”功能

智谱发布“Z Code”，轻量级 AI 代码编辑器

相关标签:

编码工具 ai gemini 架构语音生成音频编辑

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁下一篇：月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元，性能登顶人类终极考试

作者最新文章

肯德基app苹果版下载-肯德基app ios版

2025-12-27 08:52

SRT转LRC字幕格式转换官网_在线字幕格式转换入口

2025-12-27 08:55

线上怎么投诉菜鸟快递

2025-12-27 09:43

免费无人机驾驶证报考官网_无人机驾驶证免费考试官网

2025-12-27 11:12

sf轻小说官网免费_sf轻小说官网免费热门章节不限阅读

2025-12-27 11:21

全民k歌怎么录好听_全民K歌录音好听技巧汇总

2025-12-27 11:49

css3中设置元素宽度的方法

2025-12-27 12:05

京东全球购苹果手机是正品吗？全球购苹果建议买吗

2025-12-27 13:07

拼多多商家版手机怎么设置离线_拼多多商家版手机端离线模式设置

2025-12-27 13:48

谷歌3d地图下载-谷歌3d实景地图app v25.49.06.838461706 最新高清

2025-12-27 13:53

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

ape怎么转wav

ape怎么转wav

ape可以通过使用音频转换软件、使用在线转换工具和音频编辑软件的方法转wav格式。在转换完成后，可以使用音频播放器或编辑软件打开转换后的WAV文件，以确保转换质量和文件完整性。更多关于ape相关的文章，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

322

2023.11.21

ip地址修改教程大全

ip地址修改教程大全

本专题整合了ip地址修改教程大全，阅读下面的文章自行寻找合适的解决教程。

29

2025.12.26

压缩文件加密教程汇总

压缩文件加密教程汇总

本专题整合了压缩文件加密教程，阅读专题下面的文章了解更多详细教程。

12

2025.12.26

wifi无ip分配

wifi无ip分配

本专题整合了wifi无ip分配相关教程，阅读专题下面的文章了解更多详细教程。

44

2025.12.26

漫蛙漫画入口网址

漫蛙漫画入口网址

本专题整合了漫蛙入口网址大全，阅读下面的文章领取更多入口。

78

2025.12.26

b站看视频入口合集

b站看视频入口合集

本专题整合了b站哔哩哔哩相关入口合集，阅读下面的文章查看更多入口。

236

2025.12.26

俄罗斯搜索引擎yandex入口汇总

俄罗斯搜索引擎yandex入口汇总

本专题整合了俄罗斯搜索引擎yandex相关入口合集，阅读下面的文章查看更多入口。

305

2025.12.26

虚拟号码教程汇总

虚拟号码教程汇总

本专题整合了虚拟号码接收验证码相关教程，阅读下面的文章了解更多详细操作。

35

2025.12.25

错误代码dns_probe_possible

错误代码dns_probe_possible

本专题整合了电脑无法打开网页显示错误代码dns_probe_possible解决方法，阅读专题下面的文章了解更多处理方案。

25

2025.12.25

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

最新Python教程从入门到精通

最新Python教程从入门到精通

共4课时 | 0.6万人学习

Rust 教程

Rust 教程

共28课时 | 3.9万人学习

Git 教程

Git 教程

共21课时 | 2.2万人学习

最新文章

更多

纽约学校手机禁令暴露问题：部分高中生不会看指针钟表

微语 1.1.0 发布，开源智能客服

知情人士否认叮咚买菜要被京东收购：暂无收购计划

国内首例四家运营商共建，广湛高铁干线光缆项目全程通光

首都第三条 8A 编组大运量线路，北京地铁 17 号线全线贯通

国家队进场：工信部设立标委会，定调人形机器人和具身智能未来

京东航空开通“深圳 = 十堰”航线，鄂西北全货机货运实现“从无到有”

马斯克预测：AI 和机器人将彻底消除贫困与饥饿，工作是“可选项”

开发者工具箱 Kairoa v1.1.11 发布：新增配置文件格式转换、IP/域名查询工具、websocket 测试等多个实用工具

传叮咚买菜要被京东收购，双方未予置评

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部