讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

腾讯开源歌曲生成模型 SongBloom

霞舞

发布： 2025-10-11 15:49:33

原创

957人浏览过

腾讯 ai lab 联合香港中文大学（深圳）、南京大学共同推出了一款全新的开源歌曲生成模型 songbloom，其研究成果已成功入选全球顶尖人工智能会议 neurips 2025。

据介绍，SongBloom 是一款专注于高质量歌曲创作的创新性生成模型。仅需提供一段 10 秒的音频参考样本和对应歌词文本，即可自动生成时长为 2 分 30 秒、双通道/48kHz 的完整音乐作品。在主客观综合评估中，该模型不仅显著优于现有开源方案，还在音质还原度与歌词对齐精度两大关键指标上表现出色；同时，在旋律性与音乐表现力方面也接近当前领域最先进水平（SOTA）。

腾讯开源歌曲生成模型 SongBloom

SongBloom 实现了两项核心技术突破：

首次将自回归扩散机制应用于长序列歌曲生成任务。通过引入离散的 sketch token 作为“链式思维”式的中间表示，并结合 VAE latent 空间进行最终音频合成，该架构有效融合了自回归模型在结构连贯性和音素同步上的优势，以及扩散模型在连续声学特征建模中提升音质的能力，实现了“结构稳定、细节丰富、情感表达强”的高质量输出。

腾讯开源歌曲生成模型 SongBloom

研发团队提出一种全新的交替生成范式（interleaved generation），能够在“语义理解”与“声学生成”两种上下文模式之间动态切换。这一机制既保障了整首歌曲的逻辑结构完整性，又提升了局部声音质感的精细程度，为音乐生成 AI 提供了一条前所未有的技术路径。

据腾讯方面披露，在多项客观评测中，SongBloom 的美学得分不仅大幅领先主流开源基准模型，甚至媲美乃至超越部分领先的商业闭源系统；此外，模型展现出极强的歌词遵循能力，显著缓解了传统生成模型中存在的“幻觉问题”（即生成内容偏离歌词本意），并将音素错误率（PER）降至新低，推动歌词准确率迈上新台阶。

腾讯开源歌曲生成模型 SongBloom

Playground AI

Playground AI

AI图片生成和修图

Playground AI

108

Playground AI

在主观听感测试中，SongBloom 同样表现抢眼。得益于 VAE latent 所保留的高保真声学信息，其生成的人声细腻度已超越目前业内领先的闭源模型 Suno-v4.5；而在整体音乐性方面，亦达到可与多个商用模型相抗衡甚至更优的水准，使 AI 创作的音乐更加贴近专业级制作质感。

腾讯开源歌曲生成模型 SongBloom

目前，项目全部代码及预训练权重均已开放。未来，团队还将陆续发布支持长达 240 秒的完整版模型，以及增强文本控制能力的新版本。

源码地址：点击下载

以上就是腾讯开源歌曲生成模型 SongBloom的详细内容，更多请关注php中文网其它相关文章！

相关标签：

人工智能腾讯 ai 音乐 2025 架构 Token 人工智能

大家都在看：

Meta：不限制员工使用 Gemini 和 GPT 等三方 AI 模型腾讯回应 “元宝” 身份质疑：一个完全由 AI 生成内容的助手 OpenAI 开放 ChatGPT 第三方应用提交通道 xAI 发布 Grok Voice Agent API 何小鹏：当前没有 AI 泡沫，未来市场有巨大机遇

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：Anthropic 发现：仅 250 份中毒文件即可攻破大型 AI 模型下一篇：40Gbps！铁威马D1 SSD Plus化身存储神器

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

美光：AI需求高居不下预计营收大幅增长

2025-12-18 12:45:02
《怪物猎人：荒野》更新优化效果实测！帧率变化不大但显卡负载降低

2025-12-18 12:46:02
苹果发布开源 AI 模型 SHARP，将单张 2D 照片快速变成 3D 场景

2025-12-18 12:57:02
《霍格沃茨之遗》销量突破四千万份成绩惊人

2025-12-18 13:18:07
《暗黑破坏神4：憎恨之王》剧情回顾视频

2025-12-18 13:22:10
内存价格失控！乐子随之而来内存条塞金属块造假

2025-12-18 13:27:07
常玩游戏能防老年痴呆！全国首张游戏处方在浙江开出

2025-12-18 13:31:22
iOS 26.3首个公测版发布：苹果、安卓正式互通可互传数据

2025-12-18 13:39:07
CoSky v5.2.0 已经发布，基于 Redis 的服务治理平台

2025-12-18 13:44:13
3D类银河恶魔城游戏《少女与学院城》上架Steam 现已开放试玩

2025-12-18 13:50:03

最新问题

火山引擎总裁谭待：大模型市场未来将迎十倍增长今日，火山引擎在FORCE原动力大会期间正式宣布：截至今年12月，豆包大模型的日均Tokens调用量已突破50万亿，稳居中国首位、全球第三。截至目前，已有超100家企业依托火山引擎平台，累计Tokens使用量迈过一万亿大关。在被问及豆包大模型本年度整体表现时，火山引擎总裁谭待回应称，整体成果值得肯定，尤其在国内市场优势显著；但放眼全球，OpenAI与Gemini等头部模型同样实力强劲，因此我们仍需持续加码投入。值得指出的是，火山引擎自研的Seedance与Seedream

2025-12-18 20:28:02

642

蚂蚁开源 AEnvironment，面向 Agentic RL 的统一环境平台蚂蚁集团百灵大模型团队正式开源AEnvironment——一个专为AgenticRL时代打造的统一环境平台，秉持“万物皆可为环境（EverythingasEnvironment）”的核心理念。该平台基于标准化MCP协议进行深度扩展，面向环境提供商、算法研究人员及Agent开发者，提供即开即用的底层基础设施，大幅降低环境构建门槛，助力各方聚焦于Agent核心能力的研发与优化。AEnvironment核心特性包括：超强规模承载能力：已验证支持万亿参数级大模型训练，可在超长上下文场景下高效执行Agen

2025-12-18 20:26:02

226

智能知识管理系统 SKC V0.1.5 发布（支持推荐阅读） SKC智能知识库：致力于打造高性能的知识管理与智能检索平台，深度融合人工智能技术，显著提升信息组织、理解与获取效率，广泛适配教育机构、科研单位及各类企业场景。依托大语言模型与结构化知识管理体系的协同演进，为用户提供从知识生成到精准检索的一站式智能服务。V0.1.5新增“智能推荐阅读”功能重构首页界面布局，支持用户自主配置外部应用入口，实现个性化应用集成。上线“推荐阅读”模块，可在首页指定区域展示带跳转链接的图文组合内容。新增“最新知识”快捷入口区，便于用户即时触达最新入库内容。新增“常用知识”快

2025-12-18 20:15:07

998

字节跳动正式发布豆包大模型1.8 在今日举办的火山引擎Force原动力大会上，字节跳动正式推出全新升级的豆包大模型1.8版本。多项权威评测结果表明，该模型在多模态理解与生成、智能体（Agent）能力等关键维度上，已跻身行业第一梯队。据悉，豆包大模型1.8（Doubao-Seed-1.8）专为多模态智能体应用场景深度优化。其工具调用精准度、复杂指令解析与执行能力，以及操作系统级Agent（OSAgent）功能均实现显著跃升，极大强化了模型在高阶任务中的自主规划与协同执行能力。在多项主流公开基准测试中，豆包1.8于视觉推理、通用视觉

2025-12-18 20:12:08

1017

商汤旗下大晓机器人发布 ACE 具身研发范式、开悟世界模型 3.0 等商汤科技旗下大晓机器人正式推出ACE具身智能研发范式、业界首个开源并已实现商业落地的开悟世界模型3.0（Kairos3.0），以及具身超级大脑模组A1。据官方介绍，ACE具身研发范式坚持“以人为中心（Human-centric）”理念，其核心——环境式数据采集能力，可在一年内完成千万小时级真实交互数据积累；而开悟世界模型3.0则持续释放真实数据潜能，等效支撑上亿小时规模的数据训练效果。以环境式数据采集为驱动引擎，ACE构建起覆盖“环境式数据采集—开悟世界模型3.0—具身交互”的端到端技术闭环。

2025-12-18 19:27:07

912

Adobe 被诉用盗版书籍训练 AI 模型，SlimLM 陷版权风波俄勒冈州作家伊丽莎白·莱昂（ElizabethLyon）已对Adobe公司发起集体诉讼，指控其在训练名为SlimLM的轻量级语言模型过程中，非法使用了含有其受版权保护作品的盗版数据集。SlimLM是Adobe推出的一套面向移动端文档处理场景（包括文本摘要、内容重写与智能问答等）优化的小型语言模型。据Adobe官方披露，该模型基于SlimPajama-627B数据集完成预训练——该语料库由AI芯片企业Cerebras于2023年6月开源发布，标榜为“去重、多源整合、公开可用”的训练资源。

2025-12-18 19:23:02

661

Meta：不限制员工使用 Gemini 和 GPT 等三方 AI 模型据BusinessInsider报道，Meta正在放宽内部限制，扩大员工对Google、OpenAI等竞品AI工具的使用权限。内部文件及公司内部通讯显示，Meta正大力推动将人工智能工具深度融入日常工作的各个环节，并全面推行“AI优先”战略。目前，Meta员工已被授权接入并使用包括Google的Gemini3Pro、OpenAI的GPT-5在内的多个第三方大模型，以提升工作效率。与此同时，Meta已将其核心办公套件迁移至GoogleWorkspace，旨在“释放

2025-12-18 18:50:04

177

腾讯回应 “元宝” 身份质疑：一个完全由 AI 生成内容的助手腾讯旗下AI助手“元宝”近日引发用户广泛讨论，不少人在互动中反复追问：“你到底是AI还是人？”对此，腾讯官方正式回应，明确指出元宝是一款完全基于人工智能技术构建的助手，所有内容均由模型自主生成，全程无人工干预或后台润色。根据官方说明，元宝被定位为具备高感知力与高情商的智能体，不仅能高效理解语义，还能兼顾语气、分寸与情感表达，从而实现自然流畅的对话体验。正因回复质量接近甚至超越部分真人水平，反而触发了用户的“真实性怀疑”——有人调侃式发问：“元宝你回尿床吗？”元宝仅以一个“？”作答；也有人试探性别

2025-12-18 18:49:14

171

OpenAI 开放 ChatGPT 第三方应用提交通道 OpenAI正式启用第三方应用入驻ChatGPT的提交通道，面向全球开发者开放。经平台审核通过后，基于OpenAI模型开发的工具可直接集成至ChatGPT，无需用户手动下载或安装。该机制融合自动化检测与人工复核流程，审核达标的应用将原生嵌入ChatGPT界面，实现“即点即用”。当前重点招募方向涵盖生产力增强类、学术研究支持类、创意生成辅助类及垂直行业智能体等应用场景，致力于构建以自然语言对话为交互核心的AI应用生态体系。在ChatGPT的“应用（BETA）”专区中，OpenAI已

2025-12-18 18:49:02

743

索尼诉腾讯《荒野起源》侵权案达成和解，长达半年的游戏官司终于画上句号感谢网友guser的线索提供！12月18日，美国加州北区联邦地方法院发布的一份官方文件，为本年度全球游戏行业最受瞩目的跨国知识产权纠纷划上了终止符。公开信息显示，索尼已正式向法院提交撤诉申请，终结其针对腾讯旗下新作《荒野起源》所发起的侵权诉讼。目前，双方已达成具有法律约束力的保密和解协议，约定不再就本案发表任何公开声明，并表达了对未来深化协作的积极意愿。从今年7月硝烟弥漫的司法对抗，到12月悄然落幕的庭外握手，这场风波在短短五个月内完成了由法律攻防到商业关系重构的关键跃迁。置于全球游戏产业演进的

2025-12-18 18:32:07

148

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部