0

0

南科大黑科技:一键消除视频人物,特效师的救星来了!

PHPz

PHPz

发布时间:2023-05-25 14:56:29

|

743人浏览过

|

来源于51CTO.COM

转载

来自南方科技大学的这款视频分割模型,可以追踪视频中的任意事物。

不仅会“看”,还会“剪”,从视频中去掉个人,对它来说也是轻轻松松的事。

而操作上,你唯一需要做的就是点几下鼠标。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

南科大黑科技:一键消除视频人物,特效师的救星来了!

这位特效艺术家看到消息后仿佛找到了救星,直言这一产品将改变CGI行业的游戏规则。

南科大黑科技:一键消除视频人物,特效师的救星来了!

这款模型叫做TAM(Track Anything Model),是不是和Meta的图像分割模型SAM名字很像?

的确,TAM就是将SAM扩展到了视频领域,点亮了动态物体追踪的技能树。

南科大黑科技:一键消除视频人物,特效师的救星来了!

视频分割模型其实不是新技术了,但传统的分割模型并没有减轻人类的工作。

这些模型使用的训练数据全部需要人工标注,甚至在使用时还需要先用特定物体的遮罩参数进行初始化。

SAM的出现为解决这一问题提供了前提——至少初始化数据不再需要人工获取。

当然,TAM也并不是逐帧使用SAM再叠加,还需要构建对应的时空关系。

团队将SAM与名为XMem的记忆模块进行了集成。

只需要在第一帧中用SAM生成初始参数,XMem便可以指导接下来的追踪过程。

追踪的目标还可以是很多个,比如下面的清明上河图:

南科大黑科技:一键消除视频人物,特效师的救星来了!

甚至场景发生改变,也不影响TAM的表现:

南科大黑科技:一键消除视频人物,特效师的救星来了!

我们体验了一番发现,TAM采用了交互式用户界面,操作上十分简单友好。

南科大黑科技:一键消除视频人物,特效师的救星来了!

硬实力方面,TAM的追踪效果的确也不错:

南科大黑科技:一键消除视频人物,特效师的救星来了!

但是,消除功能在一些细节上的精确度还有待提高。

南科大黑科技:一键消除视频人物,特效师的救星来了!

从SAM到TAM

前文已经提到,TAM是在SAM的基础之上结合记忆能力建立时空关联实现的。

具体而言,第一步是借助SAM的静态图像分割能力对模型进行初始化。

只需一次点击,SAM就能生成目标物体的初始化遮罩参数,代替了传统分割模型中的复杂初始化过程。

豆包手机助手
豆包手机助手

豆包推出的手机系统服务级AI助手

下载

有了初始参数,团队就可以将它交给XMem,进行半人工干预训练,大大减少了人类工作量。

南科大黑科技:一键消除视频人物,特效师的救星来了!

在这一过程中,会有一些人工预测结果被用于和XMem的输出进行比较。

实际过程中,随着时间的增长,得到准确的分割结果对XMem变得越来越困难。

当结果与预期差距过大时,将进入再分割环节,这一步还是由SAM完成。

经过SAM的再优化,大部分输出结果已比较准确,但还有一部分需要人工再调整。

TAM的训练过程大致就是这样,而开头提到的物体消除的技能是TAM与E2FGVI结合形成的。

E2FGVI本身也是一个视频元素消除工具,在TAM精准分割的加持下,其工作更加有的放矢。

为了测试TAM,团队使用了DAVIS-16和DAVIS-17数据集对其进行了评估。

南科大黑科技:一键消除视频人物,特效师的救星来了!

直观感受还是很不错的,从数据上看也的确如此。

TAM虽然无需手工设置遮罩参数,但其J(区域相似度)和F(边界准确度)两项指标已十分接近手工模型。

甚至在DAVIS-2017数据集上的表现还略胜于其中的STM。

其他初始化方式中,SiamMask的表现根本无法和TAM相提并论;

另一种名为MiVOS方法虽然表现好于TAM,但毕竟已经进化了8轮……

南科大黑科技:一键消除视频人物,特效师的救星来了!

团队简介

TAM来自南方科技大学视觉智能与感知(VIP)实验室。

该实验室研究方向包括文本-图像-声音多模型学习、多模型感知、强化学习和视觉缺陷检测等。

目前团队已发表论文30余篇,获得专利5项。

团队领导人是南方科技大学郑锋副教授,博士毕业于英国谢菲尔德大学,先后供职于中科院深研院、腾讯优图等机构,于2018年进入南科大,2021年晋升为副教授。

论文地址:
https://arxiv.org/abs/2304.11968
GitHub页面:
https://github.com/gaomingqi/Track-Anything
参考链接:
https://twitter.com/bilawalsidhu/status/1650710123399233536?s=20

相关专题

更多
Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

公务员递补名单公布时间 公务员递补要求
公务员递补名单公布时间 公务员递补要求

公务员递补名单公布时间不固定,通常在面试前,由招录单位(如国家知识产权局、海关等)发布,依据是原入围考生放弃资格,会按笔试成绩从高到低递补,递补考生需按公告要求限时确认并提交材料,及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料(确认书、资格复审材料)并准时参加面试。

44

2026.01.15

公务员调剂条件 2026调剂公告时间
公务员调剂条件 2026调剂公告时间

(一)符合拟调剂职位所要求的资格条件。 (二)公共科目笔试成绩同时达到拟调剂职位和原报考职位的合格分数线,且考试类别相同。 拟调剂职位设置了专业科目笔试条件的,专业科目笔试成绩还须同时达到合格分数线,且考试类别相同。 (三)未进入原报考职位面试人员名单。

58

2026.01.15

国考成绩查询入口 国考分数公布时间2026
国考成绩查询入口 国考分数公布时间2026

笔试成绩查询入口已开通,考生可登录国家公务员局中央机关及其直属机构2026年度考试录用公务员专题网站http://bm.scs.gov.cn/pp/gkweb/core/web/ui/business/examResult/written_result.html,查询笔试成绩和合格分数线,点击“笔试成绩查询”按钮,凭借身份证及准考证进行查询。

11

2026.01.15

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

65

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

36

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

75

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

21

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

35

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
R 教程
R 教程

共45课时 | 5万人学习

ThinkPHP6.x 微实战--十天技能课堂
ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号