快手可灵&港大提出 Context-as-Memory，上下文记忆力媲美 Genie3 且问世更早

心靈之曲

发布时间：2025-08-26 16:02:01

382人浏览过

来源于php中文网

原创

香港大学与快手可灵团队近期联合发布论文《context as memory: scene-consistent interactive long video generation with memory retrieval》，提出了一种新颖的长视频生成框架——将过往生成的视频帧作为“记忆”（context-as-memory），借助context learning机制学习上下文依赖关系，从而有效维持长视频中场景的一致性。研究指出，该模型能隐式地从数据中捕捉3d结构先验，无需依赖显式的3d建模，这一思路与google deepmind最新推出的genie 3模型理念高度契合。

为高效处理可能无限延伸的历史帧序列，论文进一步引入基于相机视场（FOV）重叠度的记忆检索机制（Memory Retrieval），从全部历史帧中动态筛选出与当前生成视角最相关的帧作为条件输入。该策略显著减少了参与计算的上下文数量，大幅降低了训练和推理时的计算负担。

在数据集构建方面，团队利用Unreal Engine 5构建了包含多样化虚拟场景的长视频数据集，配备精确的相机轨迹标注，用于充分训练和验证所提方法。用户仅需提供一张起始图像，即可沿着预设或交互式相机路径，在生成的虚拟环境中自由漫游。

据论文介绍，Context as Memory 能在数十秒的时间跨度内稳定保持对原始场景中静态元素的记忆能力，并展现出良好的跨场景泛化性能。该方法致力于实现无需显式三维重建的、具有一致性的长视频生成。其主要创新点包括：

提出 Context as Memory 框架，将历史生成帧视为记忆存储，通过上下文学习实现无需3D建模的场景一致性长视频生成。
设计 Memory Retrieval 模块，采用基于相机FOV重叠的检索策略，动态选取关键历史帧作为记忆条件，极大提升了模型效率。
实验验证表明，该方法在长视频场景记忆能力上显著优于现有SOTA模型，并能在未见过的开放场景中保持良好的记忆连贯性。

快手可灵&港大提出 Context-as-Memory，上下文记忆力媲美 Genie3 且问世更早

如上图（a）所示，Context-as-Memory 的长视频生成基于自回归视频生成框架，结合context learning技术，将所有已生成的历史帧作为上下文输入，充当“记忆”的载体。

讯飞绘文

讯飞绘文：免费AI写作/AI生成文章

下载

如上图（b）所示，为避免全历史帧参与带来的计算爆炸，研究团队设计了Memory Retrieval模块。该模块依据当前预测帧与历史帧之间的相机视场（FOV）重叠程度，动态检索最相关的关键帧作为记忆条件，有效减少了上下文学习负担，显著提升了训练与推理效率。

实验结果表明，相较于当前最先进的方法，Context-as-Memory 在长视频生成中的场景一致性与记忆保持能力方面均实现了显著提升。

快手可灵&港大提出 Context-as-Memory，上下文记忆力媲美 Genie3 且问世更早

全新 Rebebuca 重磅发布——快捷命令管理工具

合同到期，Excel 自动弹窗提醒

贾伯斯曾嫌触控笔！2026展望iPhone Fold支援笔功能恐成转单关键

美国尝试回收冷战遗留核废料，计划提取全球唯一未分离钚-244

美的联手海思：上海星闪开放实验室正式揭牌，聚焦智能家居无线通信技术研发

快手极速版

快手极速版是一款看视频看直播领现金app，海量视频精挑细选，看更流行的，玩更热门的，覆盖全网千万精彩原创小视频，浏览起来更省流量，有需要的小伙伴快来保存下载体验吧！

下载

相关标签:

快手视频生成

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：字节跳动内测全新 3D 模型生成工具 “3D Model Generator” 下一篇：微软分享有关开源 Windows 11 UI 的新细节

作者最新文章

《赣服通》个体户报税方法

2026-01-04 09:54

时隙之旅进阶配队攻略

2026-01-04 09:59

《三国群英传：策定九州》廖化介绍

2026-01-04 10:00

《嗨学课堂》激活学习卡方法

2026-01-04 10:03

Lexis Audio Editor使用指南：编辑、降噪、提升音质全攻略

2026-01-04 10:05

爱奇艺极速版怎么修改手机号

2026-01-04 10:06

Incorrect Quotes 动画创作：角色、技巧与灵感

2026-01-04 10:06

调查问卷赚钱攻略：如何避免被骗并最大化收益

2026-01-04 10:10

AI图像生成重塑创意产业：机遇与挑战并存

2026-01-04 10:12

《唱吧》移动网络下自动播放视频开启与关闭方法

2026-01-04 10:14

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

漫画合集pdf网盘入口_漫画解说合集一口气看完

精选高人气漫画合集PDF，一站式网盘入口直达！深度漫画解说整合，一口气看完经典与新作，剧情梳理清晰，省时省力，追漫党必看合集。

2026.01.04

Java云原生微服务开发_Java如何开发云原生微服务

Java云原生微服务开发是指利用Java语言，结合云原生理念和技术（如容器、Kubernetes），将大型应用拆解为一系列独立、小巧、松耦合的微服务，并通过轻量级API进行通信，实现快速开发、部署、弹性伸缩和高效运维的现代化应用开发模式。它融合了微服务架构（将应用拆分）与云原生技术（容器化、编排、自动化），旨在构建高可用、可扩展的分布式系统。

2026.01.04

php源码安装教程大全

本专题整合了php源码安装教程，阅读专题下面的文章了解更多详细内容。

246

2025.12.31

php网站源码教程大全

本专题整合了php网站源码相关教程，阅读专题下面的文章了解更多详细内容。

130

2025.12.31

视频文件格式

本专题整合了视频文件格式相关内容，阅读专题下面的文章了解更多详细内容。

152

2025.12.31

不受国内限制的浏览器大全

想找真正自由、无限制的上网体验？本合集精选2025年最开放、隐私强、访问无阻的浏览器App，涵盖Tor、Brave、Via、X浏览器、Mullvad等高自由度工具。支持自定义搜索引擎、广告拦截、隐身模式及全球网站无障碍访问，部分更具备防追踪、去谷歌化、双内核切换等高级功能。无论日常浏览、隐私保护还是突破地域限制，总有一款适合你！

124

2025.12.31