近日,谷歌在深夜悄然升级了其旗舰级视频生成模型——veo 3.1,消息一经放出便迅速引爆全网热议,相关平台用户已狂刷出2.75亿条ai生成视频。这一波更新,也让刚刚亮相不久的sora 2倍感压力。
Veo 3.1此次迭代聚焦两大核心能力跃升:
一是叙事理解与音频协同控制能力大幅增强
二是多模态输入支持与精细化编辑功能显著拓展
这次升级让AI不再只是“按指令出图”,而是真正开始理解故事逻辑、角色关系与情绪节奏,将AI视频创作推进至「导演级」精准调控新阶段。画面真实感与电影化叙事感同步提升,画质更细腻、音画同步更自然,整体质感愈发接近专业影视作品。
在技术接入层面,Veo 3.1现已全面集成Gemini API与Vertex AI平台。普通用户可直接通过Google Flow或Gemini网页端体验该模型。若选择Flow,只需访问 labs.google/flow/about,点击新建项目即可开启创作;在Gemini中,则进入“创建Video”模块,系统将自动调用Veo 3.1引擎。
为直观验证效果,我们使用极简提示词「威尔斯吃面」进行测试,生成结果流畅度与生活化表现令人惊喜。在首尾帧控制测试中,输入「奥特曼最后像钢铁侠一样飞走」,模型不仅准确还原动作起止状态,还实现了富有张力的镜头衔接与动态延续。
Veo 3.1另一大突破在于:它能将多张不同人物、物体的照片智能融合进统一场景,并自动生成匹配氛围的配音与环境音效。同时支持生成更长时长的连贯视频——单次输出最长可达1分钟以上,且能延续原始镜头中的运动轨迹与角色姿态。每个后续片段均以此前视频的最后一秒为起点,确保背景、光影、人物造型等关键元素高度一致。只需提供首帧与末帧图像,Veo即可构建出具备宏大运镜与无缝转场的完整短片。强烈建议优先通过Flow平台深度体验这一能力。
早在5个月前,谷歌就正式发布了由Veo驱动的AI电影制作工具Flow。截至目前,官方数据显示,全球用户已在Flow中累计生成超2.75亿段视频。本次Veo 3.1更新同步带来了全新剪辑与编辑功能,进一步释放创作者的想象力边界。
值得一提的是,Flow内置的Flow TV功能,宛如一座AI驱动的创意电视台——用户可随时“换台”,浏览他人生成的千奇百怪的短视频内容,所有频道均通过工作台一键切换。目前这2.5亿条视频已被智能归类为多个趣味频道,例如「碰撞测试」「打招呼」「感到可爱」等,极具探索乐趣。
而Short Films专区则主打精品微电影,制作水准更高、叙事结构更完整,单部时长也明显延长。目前已上线3部作品,其中名为《FreeLancers》的短片尤为引人注目:故事发生在纽约一家隐秘餐厅,两位多年未见的养兄弟共进晚餐——一位行事缜密、步步为营,另一位张扬不羁、冲动鲁莽。两人在追忆往昔时,逐渐揭开彼此曾同为国际杀手的秘密,直到最终惊觉:他们竟被同一雇主招募,任务目标竟是——互相刺杀。
从硬性参数来看,Veo 3.1支持输出720p或1080p高清分辨率视频,标准帧率为24fps;基础生成时长提供4秒、6秒、8秒三档可选;启用Extend扩展功能后,最长可延伸至148秒。
那么问题来了:Veo 3.1是否真能超越Sora 2?客观而言,本次升级更偏向「控制力强化」而非「质变式飞跃」——新增了首尾帧精准锚定、多图参考合成等实用功能,但在成片观感上,相较Veo 3提升幅度有限,部分画面仍略显生硬与失真。原生最长仅支持8秒输出,即便借助Flow延长至30秒,偶有画面衔接断裂、动作跳变等问题;音频质量虽有优化,但尚未达到惊艳水准。
基础物理模拟虽比前代更稳,一旦涉及复杂人物微表情、多角色调度或高难度运镜,仍易暴露算法局限。不过,这毕竟只是Veo 3到3.1的一次渐进式打磨。业界普遍预期,谷歌将在今年年底祭出重磅更新,大概率将携手Gemini 3全系模型同步登场,届时或将真正掀起新一轮AI视频革命。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜














