讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

DeepMind 推出 “帧链” 概念：视频模型或将实现全面视觉理解

心靈之曲

发布： 2025-09-30 17:15:33

原创

748人浏览过

deepmind 推出 “帧链” 概念：视频模型或将实现全面视觉理解

DeepMind 最新研究提出了一项突破性理念——“帧链”（Chain-of-Frames, CoF），这一概念可视为视觉领域的“思维链”（CoT）。正如链式思维让大语言模型具备符号推理能力，帧链则赋予视频生成模型在时空维度上进行连贯推理的能力，仿佛为其注入了自主的视觉思维。

该团队在论文中抛出了一个极具挑战性的问题：视频模型是否也能像大型语言模型（LLM）那样，无需针对特定任务专门训练，就能完成多样化的视觉理解任务？当前的计算机视觉系统仍处于碎片化阶段，每项任务如目标检测、语义分割等都需要独立设计与训练模型，缺乏统一的通用性。

为验证这一设想，研究人员采用极简方式测试：仅输入一张初始图像和一段文字指令，要求模型自动生成一段分辨率为720p、时长8秒的视频。这种提示驱动的方式模仿了大模型的零样本推理机制，旨在挖掘视频模型内在的泛化潜力。

实验结果令人震惊：Veo3 模型在多项标准视觉任务中展现出卓越表现，不仅具备基础的感知与建模能力，还能对复杂场景进行动态操控。尤其在涉及跨时间与空间的视觉推理任务中，它能自主规划合理的动作路径，成功应对多步骤视觉难题。

家作

淘宝推出的家装家居AI创意设计工具

149

DeepMind 推出 “帧链” 概念：视频模型或将实现全面视觉理解

研究最终归纳出三大关键发现：

广泛的任务适应性：Veo3 能够处理大量未曾专门训练过的视觉任务，显示出接近通用视觉系统的潜力。
初步视觉推理能力：通过生成的视频序列分析，模型展现出类似“帧链”的推理过程，逐步构建对环境的理解。
快速进化趋势：尽管专用模型目前仍具优势，但 Veo3 的进步速度惊人，预示着通用视觉模型的时代可能即将到来。

DeepMind 预测，未来的通用视频模型或将逐步取代传统专用模型，正如 GPT-3 奠定了大语言模型的基础地位一样，新一代视觉模型有望成为多任务视觉智能的核心平台。

以上就是DeepMind 推出 “帧链” 概念：视频模型或将实现全面视觉理解的详细内容，更多请关注php中文网其它相关文章！

相关标签：

计算机 ai gpt 大模型 gpt 视频生成

大家都在看：

金士顿警告：NAND 闪存价格将持续上涨，一个月后更贵 AI将让全民拥平均高收入？马斯克预言20年后你不一定要去上班！白宫启动「科技部队」计画：苹果等众多科技巨头菁英将入驻联邦机构 Thinking Machines Lab 正式发布首款产品 Tinker 开源强化学习框架 AReaL v0.5.0 发布，新增解耦式 Agentic RL

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：智谱发布最新旗舰模型 GLM-4.6，代码能力全面进阶下一篇：开源喷墨打印机 Open Printer 亮相：搭载树莓派、可自行维修

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

鸠摩搜索引擎入口

2025-12-15 12:48:08
大刀砍鬼子！国产抗日《斗虎》新实机东北战神来了

2025-12-15 12:57:01
《影之刃零》女角脸模章谨之：看到游戏形象很开心

2025-12-15 13:11:12
Windows 11什么配置才能爽玩游戏：微软给出官方答案

2025-12-15 13:15:11
两作全都拿到TGA最佳动作大奖！《哈迪斯2》官方发文致谢

2025-12-15 13:15:24
一加Turbo系列官宣李杰：同档性能、续航强得可怕

2025-12-15 13:39:07
新三国志曹操传马超无双试炼三通关攻略

2025-12-15 13:39:17
不安全不可靠！ voices38抨击虚拟机攻破D加密方法

2025-12-15 13:44:23
打对折！《天国：拯救2》Steam迎来新史低

2025-12-15 13:47:12
全新内存来了！性能秒杀DDR5/GDDR7

2025-12-15 14:04:28

最新问题

RuleGo v0.35.0 发布：国产轻量级、全场景、新一代组件编排规则引擎 RuleGo是一款基于Go语言打造的轻量级、高效率、可嵌入、支持组件化编排的新一代规则引擎。它助力开发者快速构建松耦合、高灵活性的系统，轻松应对复杂多变的业务逻辑。RuleGo内置丰富的可复用组件，涵盖数据聚合、条件过滤、消息分发、格式转换、上下文丰富化以及各类动作执行等能力，并原生支持与多种协议（如HTTP、MQTT、gRPC、WebSocket等）及外部系统无缝对接与集成，广泛适用于自动化营销、物联网平台、企业应用集成等场景。其架构在内存占用与运行性能方面经过深度优化，资源消耗极低——既可

2025-12-17 20:34:23

175

新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图人工智能在解析人类行为方面实现了关键性突破。得克萨斯农工大学（TexasA&MUniversity）的研究团队近期推出了一款名为“OmniPredict”的创新人工智能系统，该系统展现出前所未有的意图预判能力——它不仅可识别视觉中的人体动作，更能融合多源环境信息，实时推演人类即将采取的行为意图。这项成果标志着自动驾驶技术正由“感知响应”迈向“认知预判”的全新阶段。传统自动驾驶系统大多依赖对行人位置与运动轨迹的即时检测，而OmniPredict则深度融合了多模态大语言模型（MLLM）架构，赋

2025-12-17 20:34:03

566

AI 数据平台 Databricks 启动 L 轮融资，估值达 1340 亿美元据《华尔街日报》独家披露，专注于数据分析与人工智能软件的科技企业Databricks近期完成L轮融资，融资金额逾40亿美元，公司最新估值攀升至约1340亿美元，相较今年夏季增长34%。截至10月底，其年度经常性收入（ARR）已达48亿美元。Databricks明确表示，将在明年面向全球大规模扩招，新增岗位数量达数千个，其中重点聚焦AI领域顶尖科研人才，并持续深化与OpenAI、Anthropic等前沿AI公司的战略合作，加速推动企业级AI智能体的落地应用。本轮融资由InsightPartners

2025-12-17 19:07:11

275

SamWaf v1.3.18 开源、轻量级、私有化部署网站防火墙本次更新重点围绕社区近期提出的新增需求与已知问题展开迭代，涵盖功能增强、体验优化及稳定性修复自本版本起全面引入gormigrate进行数据库迁移管理，为后续架构演进与版本兼容性打下基础首次集成系统级防火墙联动能力，支持直接阻断指定IP对服务器的全链路访问（不限于Web层）升级明细如下：新增：CC防护模块支持按条件动态启用规则，提升防御灵活性。感谢(@blue991989)新增：提供一键式配置备份与还原功能，含完整配置文件快照。感谢(@SONGjiemo)新增：内置查询分

2025-12-17 19:02:02

118

腾讯大模型团队架构调整，新成立 AI Infra 部、AI Data 部、数据计算平台部据36氪《智能涌现》独家消息，腾讯近日完成新一轮组织架构升级，正式组建AIInfra部、AIData部及数据计算平台部三大新部门。据悉，12月17日下午发布的内部通知显示，VincesYao将担任“CEO/总裁办公室”首席AI科学家，直接向腾讯总裁刘炽平汇报；同时，他还将兼任AIInfra部与大语言模型部负责人，向技术工程事业群总裁卢山汇报。VincesYao即此前数月加入腾讯的姚顺雨，其本科就读于清华大学“姚班”，后于普林斯顿大学获得计算机科学博士学位，曾就职于OpenAI，是该公司首批智能体

2025-12-17 18:38:23

486

京东外卖在全国范围上线“自提”功能 12月17日消息，今日京东外卖正式在全国范围推出“自提”服务，用户可享受“线上下单、到店取货、即提即走”的便捷体验。平台同步启动“京东外卖请客·自提一分抢”活动：大牌品牌轮番请客，整点限量1分钱抢购，选择自提方式还可额外立减1元。据京东发布的2025年第二季度及中期业绩公告，公司当季营收达3567亿元，创下近三年来最快收入增速；京东外卖日均订单量已突破2500万单，服务网络覆盖全国350座城市。值得关注的是，京东集团董事局主席刘强东曾公开指出，京东布局外卖业务的根本出发点在于深耕生鲜供应链能力—

2025-12-17 18:17:02

449

何小鹏：当前没有 AI 泡沫，人形机器人将来会是巨头的竞争感谢网友软媒新友2497150、啊俊、HH_KK的线索提供！12月17日讯，今日，小鹏汽车董事长何小鹏在其社交平台发布动态，围绕AI是否存在泡沫、物理AI的演进路径、美国新兴创业生态与机器人发展态势，以及通用人工智能（AGI）的现实进展等焦点议题，分享了个人观察与思考。何小鹏指出，人形机器人赛道未来将主要由科技巨头主导竞争；而面向特定场景的专用机器人，则会涌现大量垂直领域创新企业，并孕育极为丰富的商业成功机会。在他看来，当前AI领域并不存在系统性泡沫，AI所承载的产业空间与社会价值仍处于

2025-12-17 17:44:08

236

智元提出 WholeBodyVLA，面向真实世界的人形机器人全身 VLA 框架智元AGIBOT宣布，由香港大学、智元AGIBOT、复旦大学及上海创智学院组成的跨机构研究团队共同推出WholeBodyVLA——一种专为真实场景下双足人形机器人设计的全身级Vision–Language–Action统一框架。https://opendrivelab.com/WholeBodyVLA/https://github.com/OpenDriveLab/WholebodyVLA据悉，该成果依托智元灵犀X2平台开展研究，首次将视觉-语言-动作（VLA）范式系统性拓展至人形机器人全身运

2025-12-17 17:25:03

661

北极气温再创新高，自 1900 年有记录以来的最高值感谢网友Djoker_Huang提供的线索！12月17日消息，新华社今日援引美国国家海洋和大气管理局（NOAA）于16日发布的《北极年度气候报告》指出，在2024年10月至2025年9月这一年度统计周期中，北极地表平均气温达到自1900年系统观测以来的历史最高水平。报告进一步指出，过去十年是北极有气象记录以来最热的十年。自2006年起，该区域年均升温速率已突破全球平均水平的两倍以上。此外，据TechSpot今年8月报道，尽管全球整体气温持续攀升，但过去二十年间北极海冰的消融速率却呈现出明显趋缓态

2025-12-17 17:15:08

737

小米推出网页版 AI 聊天服务：Xiaomi MiMO Studio 今日上午，小米公司在2025年小米人车家全生态合作伙伴大会上正式推出并全面开源全新MoE架构大模型——MiMo-V2-Flash，同时上线网页端AI聊天平台：XiaomiMiMOStudio。用户可通过该平台直接体验开源版MiMO-V2-Flash模型。XiaomiMiMOStudio具备深度检索与实时联网搜索能力，支持多场景智能交互，包括自然语言问答、内容创作与润色、逻辑推理与分析、跨语言翻译、创意灵感激发、代码生成与调试等核心功能。使用需登录小米账号，当前API接口处于限

2025-12-17 17:03:07

1359

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

SciPy 教程

8216次学习
收藏
R 教程

36171次学习
收藏
SQL 教程

28081次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部