谷歌新一代视频生成大模型veo2横空出世,其4k高清分辨率和对电影拍摄技巧的掌握,令sora黯然失色,展现出“更懂人间烟火”的生成能力。然而,目前veo2生成的视频仍处于无声阶段。
Veo2生成视频,来自X网友@moderncpp7,背景音效为作者后期添加。
与此同时,国内互联网公司另辟蹊径,实现了“视听同步生成”的突破。只需上传一段视频,音乐大模型即可快速生成30秒的MV!
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
中文发音清晰自然,歌词与画面高度契合,节奏感十足。(原视频16秒,MV时长亦为16秒)
过去,制作这样的MV需要先用音乐大模型生成音频,再用剪辑软件进行后期合成。而现在,音乐大模型能够直接输出完整的MV,无需任何提示词。
趣丸科技“天谱乐”:全球首创一键配乐AI模型
今年7月,趣丸科技推出全球首个多模态配乐大模型“天谱乐”。趣丸科技深耕音乐音频领域,旗下TT语音拥有超过2亿注册用户,是国内领先的兴趣社交平台。
AI音乐创作平台-天谱乐官网
“天谱乐”支持文本生曲(最长3.5分钟),并率先实现图片生曲和视频生曲的多模态能力。用户上传图片或60秒内的视频,即可生成30秒MV效果的匹配BGM。
文本生成歌曲,提示词:创作一首关于当代年轻人青春热血的歌曲。
上传《好东西》剧照后,“天谱乐”生成的歌曲。
为李子柒的制茶视频配乐,展现浓厚的国风韵味。
与Suno等模型相比,“天谱乐”在人声处理方面取得了显著突破,有效降低了电音感,提升了人声的真实度和专业性,接近音乐发行级别。这得益于其在大模型长序列音乐语意建模和高质量音频空间建模方面的技术进步。
“天谱乐”能够精准识别画面情绪和基调,实现卡点匹配,生成高度贴合内容的背景音乐,展现出国际领先的多模态理解与生成能力。目前,“天谱乐”已全面接入趣丸旗下唱鸭App,累计注册用户达4600万,创作歌曲近千万首。
国内AI音乐生成应用三分天下
2024年,国内AI音乐生成领域竞争激烈,趣丸科技“天谱乐”与字节跳动、昆仑万维两家形成“三分天下”的格局。昆仑万维的“天工SkyMusic”音质出色,支持多种方言歌曲创作,但目前仅支持文本生曲。字节跳动的豆包音乐大模型已接入豆包App和海绵音乐App,支持文本和图片生曲,在人声清晰度和国风音乐处理上表现出色。
相比之下,网易云音乐和腾讯音乐的AI辅助创作平台则更侧重于专业创作者,在“一键生成”功能上相对保守。
商用领跑,跨界共创
国内AI音乐模型更贴合本土市场需求,在中文歌曲创作方面表现优异。国内互联网企业将重点放在降低创作门槛上,满足C端用户和自身业务需求,例如抖音等平台对海量BGM的需求。
“天谱乐”等模型正朝着双轨并行方向发展:一方面面向普通用户提供娱乐性音乐生成服务;另一方面为专业人士提供更精准的参数控制和创作辅助,例如即将推出的MidiRender功能,将增强音乐生成的编辑性和可控性。
MidiRender类似音乐界的ControlNet,允许创作者输入原创音乐片段,再由AI完成歌词填充和编曲,实现更精确的创作控制。
AI大模型作为创作工具,最终服务于人,与艺术家合作共创音乐的未来。
以上就是围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号