谷歌深夜上新Veo 3.1，网友刷2.75亿条，Sora 2压力山大！

絕刀狂花

发布时间：2026-01-05 08:58:15

695人浏览过

来源于php中文网

原创

近日，谷歌在深夜悄然升级了其旗舰级视频生成模型——veo 3.1，消息一经放出便迅速引爆全网热议，相关平台用户已狂刷出2.75亿条ai生成视频。这一波更新，也让刚刚亮相不久的sora 2倍感压力。

Veo 3.1此次迭代聚焦两大核心能力跃升：

一是叙事理解与音频协同控制能力大幅增强
二是多模态输入支持与精细化编辑功能显著拓展
这次升级让AI不再只是“按指令出图”，而是真正开始理解故事逻辑、角色关系与情绪节奏，将AI视频创作推进至「导演级」精准调控新阶段。画面真实感与电影化叙事感同步提升，画质更细腻、音画同步更自然，整体质感愈发接近专业影视作品。

在技术接入层面，Veo 3.1现已全面集成Gemini API与Vertex AI平台。普通用户可直接通过Google Flow或Gemini网页端体验该模型。若选择Flow，只需访问 labs.google/flow/about，点击新建项目即可开启创作；在Gemini中，则进入“创建Video”模块，系统将自动调用Veo 3.1引擎。

为直观验证效果，我们使用极简提示词「威尔斯吃面」进行测试，生成结果流畅度与生活化表现令人惊喜。在首尾帧控制测试中，输入「奥特曼最后像钢铁侠一样飞走」，模型不仅准确还原动作起止状态，还实现了富有张力的镜头衔接与动态延续。

Veo 3.1另一大突破在于：它能将多张不同人物、物体的照片智能融合进统一场景，并自动生成匹配氛围的配音与环境音效。同时支持生成更长时长的连贯视频——单次输出最长可达1分钟以上，且能延续原始镜头中的运动轨迹与角色姿态。每个后续片段均以此前视频的最后一秒为起点，确保背景、光影、人物造型等关键元素高度一致。只需提供首帧与末帧图像，Veo即可构建出具备宏大运镜与无缝转场的完整短片。强烈建议优先通过Flow平台深度体验这一能力。

早在5个月前，谷歌就正式发布了由Veo驱动的AI电影制作工具Flow。截至目前，官方数据显示，全球用户已在Flow中累计生成超2.75亿段视频。本次Veo 3.1更新同步带来了全新剪辑与编辑功能，进一步释放创作者的想象力边界。

值得一提的是，Flow内置的Flow TV功能，宛如一座AI驱动的创意电视台——用户可随时“换台”，浏览他人生成的千奇百怪的短视频内容，所有频道均通过工作台一键切换。目前这2.5亿条视频已被智能归类为多个趣味频道，例如「碰撞测试」「打招呼」「感到可爱」等，极具探索乐趣。

而Short Films专区则主打精品微电影，制作水准更高、叙事结构更完整，单部时长也明显延长。目前已上线3部作品，其中名为《FreeLancers》的短片尤为引人注目：故事发生在纽约一家隐秘餐厅，两位多年未见的养兄弟共进晚餐——一位行事缜密、步步为营，另一位张扬不羁、冲动鲁莽。两人在追忆往昔时，逐渐揭开彼此曾同为国际杀手的秘密，直到最终惊觉：他们竟被同一雇主招募，任务目标竟是——互相刺杀。

CoCo

智谱AI推出的首个有记忆的企业自主Agent智能体

下载

从硬性参数来看，Veo 3.1支持输出720p或1080p高清分辨率视频，标准帧率为24fps；基础生成时长提供4秒、6秒、8秒三档可选；启用Extend扩展功能后，最长可延伸至148秒。

那么问题来了：Veo 3.1是否真能超越Sora 2？客观而言，本次升级更偏向「控制力强化」而非「质变式飞跃」——新增了首尾帧精准锚定、多图参考合成等实用功能，但在成片观感上，相较Veo 3提升幅度有限，部分画面仍略显生硬与失真。原生最长仅支持8秒输出，即便借助Flow延长至30秒，偶有画面衔接断裂、动作跳变等问题；音频质量虽有优化，但尚未达到惊艳水准。

基础物理模拟虽比前代更稳，一旦涉及复杂人物微表情、多角色调度或高难度运镜，仍易暴露算法局限。不过，这毕竟只是Veo 3到3.1的一次渐进式打磨。业界普遍预期，谷歌将在今年年底祭出重磅更新，大概率将携手Gemini 3全系模型同步登场，届时或将真正掀起新一轮AI视频革命。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜