谷歌近日发布了其视频生成模型veo3.1,作为今年5月推出的veo3的进阶版本。此次升级在音频生成、编辑控制精度以及图像转视频的表现质量上均有显著优化,能够产出更加逼真的视频内容,并更精准地响应用户的提示指令。
在功能方面,Veo3.1支持向现有画面中添加新对象,系统会自动将其与原始场景的视觉风格相融合,实现自然衔接。谷歌还预告,其视频编辑工具Flow即将上线移除视频中已有对象的功能,进一步提升创作过程中的灵活性与可控性。

此前,Veo3已具备多种高级编辑能力,例如基于参考图像生成角色动作、由首尾帧自动生成中间动画,以及根据末帧延伸视频内容等。而Veo3.1的关键突破在于为所有这些编辑操作新增了音频生成功能,使得输出的视频不仅包含画面,还能配备匹配情境的声音元素,显著增强了视听体验的真实感与沉浸感。
从发布渠道来看,Veo3.1将通过多个平台向用户开放。谷歌正将其集成至自家视频编辑工具Flow、Gemini应用,以及面向开发者的Vertex AI和Gemini API中。官方数据显示,自Flow于5月上线以来,用户已累计创作超过2.75亿个AI生成视频,显示出强劲的应用需求。
此次更新反映了AI视频生成技术的两大发展趋势:一是生成质量的不断提升——包括画质真实性、动作连贯性和对提示语的理解准确性;二是编辑能力日益精细化——从整体生成逐步发展到局部修改、对象增删等更为复杂的操作。同时,音频生成的引入也弥补了当前多数AI视频工具缺乏声音支持的普遍短板。
然而,整体技术仍处于快速演进阶段。在视频时序一致性、物理规律遵循、复杂动态场景处理等方面,行业内的各类模型仍在持续优化。Veo3.1在实际应用中的表现,如音画同步的精准度、新增对象与原场景融合的自然程度等细节,仍有待大量用户实践来检验和反馈。
以上就是谷歌 Veo 3.1 正式发布:新增音频功能和精细化编辑能力的详细内容,更多请关注php中文网其它相关文章!
谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁,使用起来得心应手。这里提供了谷歌浏览器纯净安装包,有需要的小伙伴快来保存下载体验吧!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号