首页 > 新闻 > IT新闻 > 正文

腾讯开源歌曲生成模型 SongBloom

霞舞
发布: 2025-10-11 15:49:33
原创
913人浏览过

腾讯 ai lab 联合香港中文大学(深圳)、南京大学共同推出了一款全新的开源歌曲生成模型 songbloom,其研究成果已成功入选全球顶尖人工智能会议 neurips 2025

据介绍,SongBloom 是一款专注于高质量歌曲创作的创新性生成模型。仅需提供一段 10 秒的音频参考样本和对应歌词文本,即可自动生成时长为 2 分 30 秒、双通道/48kHz 的完整音乐作品。在主客观综合评估中,该模型不仅显著优于现有开源方案,还在音质还原度与歌词对齐精度两大关键指标上表现出色;同时,在旋律性与音乐表现力方面也接近当前领域最先进水平(SOTA)。

腾讯开源歌曲生成模型 SongBloom

SongBloom 实现了两项核心技术突破:

  • 首次将自回归扩散机制应用于长序列歌曲生成任务。通过引入离散的 sketch token 作为“链式思维”式的中间表示,并结合 VAE latent 空间进行最终音频合成,该架构有效融合了自回归模型在结构连贯性和音素同步上的优势,以及扩散模型在连续声学特征建模中提升音质的能力,实现了“结构稳定、细节丰富、情感表达强”的高质量输出。

腾讯开源歌曲生成模型 SongBloom

  • 研发团队提出一种全新的交替生成范式(interleaved generation),能够在“语义理解”与“声学生成”两种上下文模式之间动态切换。这一机制既保障了整首歌曲的逻辑结构完整性,又提升了局部声音质感的精细程度,为音乐生成 AI 提供了一条前所未有的技术路径。

据腾讯方面披露,在多项客观评测中,SongBloom 的美学得分不仅大幅领先主流开源基准模型,甚至媲美乃至超越部分领先的商业闭源系统;此外,模型展现出极强的歌词遵循能力,显著缓解了传统生成模型中存在的“幻觉问题”(即生成内容偏离歌词本意),并将音素错误率(PER)降至新低,推动歌词准确率迈上新台阶。

腾讯开源歌曲生成模型 SongBloom

腾讯混元文生视频
腾讯混元文生视频

腾讯发布的AI视频生成大模型技术

腾讯混元文生视频137
查看详情 腾讯混元文生视频

在主观听感测试中,SongBloom 同样表现抢眼。得益于 VAE latent 所保留的高保真声学信息,其生成的人声细腻度已超越目前业内领先的闭源模型 Suno-v4.5;而在整体音乐性方面,亦达到可与多个商用模型相抗衡甚至更优的水准,使 AI 创作的音乐更加贴近专业级制作质感。

腾讯开源歌曲生成模型 SongBloom

目前,项目全部代码及预训练权重均已开放。未来,团队还将陆续发布支持长达 240 秒的完整版模型,以及增强文本控制能力的新版本。

源码地址:点击下载

以上就是腾讯开源歌曲生成模型 SongBloom的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号