0

0

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

WBOY

WBOY

发布时间:2024-04-03 12:04:01

|

1208人浏览过

|

来源于51CTO.COM

转载

0. 这篇文章干了啥?

提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。

下面一起来阅读一下这项工作~

1. 论文信息

标题:DepthFM: Fast Monocular Depth Estimation with Flow Matching

作者:Ming Gui, Johannes S. Fischer, Ulrich Prestel, Pingchuan Ma, Dmytro Kotovenko, Olga Grebenkova, Stefan Andreas Baumann, Vincent Tao Hu, Björn Ommer

机构:MCML

原文链接:https://arxiv.org/abs/2403.13788

代码链接:https://github.com/CompVis/depth-fm

官方主页:https://depthfm.github.io/

2. 摘要

针对许多下游观光任务和应用至关重要。目前针对此问题的判别式方法受到模糊伪影的限制,而最先进的生成方法由于其SDE性质导致训练样本速度缓慢。我们不是从噪声开始,而是寻求从输入图像到深度图像的直接映射。我们观察到这可通过流匹配来有效地构建,因为其在解空间中的直线轨迹提供了效率和高质量。我们的研究表明,预先训练的图像扩散模型可用于作为流匹配深度模型的充分先验知识。在复杂自然场景的基准测试中,尽管仅在少量合成数据上进行训练,我们的轻量级方法以有利的低计算成本表现出最先进的性能。

3. 效果展示

DepthFM是一种具有强零样本泛化能力的快速推理流匹配模型,可利用强大的先验知识,并且很容易地泛化到未知的真实图像中。在合成数据上进行训练后,模型可以很好地泛化到未知的真实图像中,并对深度图像进行精确匹配。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

与其他最先进的模型相比,DepthFM仅用一个函数评估就获得了明显更清晰的图像。Marigold的深度估计耗时是DepthFM的两倍,但无法生成相同粒度的深度图。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

4. 主要贡献

(1)提出了DepthFM,一种最先进的、多功能的、快速的单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修补和深度条件图像合成等下游任务中的最新能力。

(2)展示了将强大的图像先验从扩散模型成功转移到流匹配模型,几乎不依赖于训练数据,也不需要真实世界的图像。

(3)表明,流匹配模型高效,并能在单个推理步骤内合成深度图。

(4)尽管仅在合成数据上进行训练,但DepthFM在基准数据集和自然图像上表现出色。

造好物
造好物

一站式AI造物设计平台

下载

(5)将表面法线损失作为辅助目标,以获得更准确的深度估计。

(6)除了深度估计,还可可靠地预测其预测的置信度。

5. 具体原理是啥?

训练Pipeline。 训练受到流匹配和表面法向损失的限制:对于流匹配,使用数据依赖的流匹配来回归地面真实深度与对应图像之间的向量场。此外,通过一个表面法向损失来实现几何真实感。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

数据相关的流匹配: DepthFM通过利用图像到深度对,回归出图像分布和深度分布之间的直线向量场。这种方法在不牺牲性能的情况下促进了高效的几步推理。

从扩散先验微调: 作者展示了成功将强大的图像先验从基础图像合成扩散模型(Stable Diffusion v2-1)转移到流匹配模型,几乎不依赖训练数据,并且不需要真实世界的图像。

辅助表面法线损失: 考虑到DepthFM只在合成数据上进行训练,大多数合成数据集提供了地面真实表面法线,将表面法线损失作为辅助目标,以增强DepthFM深度估计的准确性。

6. 实验结果

DepthFM通过仅在63k纯合成样本上进行训练展现出了显著的泛化能力,并且能够在室内外数据集上进行零-shot深度估计。表1定性地展示了DepthFM与最先进的对应模型的性能对比。虽然其他模型通常依赖于大量数据集进行训练,但DepthFM利用了基于扩散的基础模型中固有的丰富知识。这种方法不仅节省了计算资源,而且强调了模型的适应性和训练效率。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

对基于扩散的Marigold深度估计、流匹配(FM)基准和DepthFM模型进行比较。每种方法仅使用一个集合成员进行评估,并针对两个常见基准数据集进行不同数量的函数评估(NFE)。与FM基准相比,DepthFM集成了训练过程中的法线损失和数据相关的耦合。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

对于Marigold和的DepthFM模型在不同数量的功能评估中的定性结果。值得注意的是,通过一步推断,Marigold并没有给出任何有意义的结果,而DepthFM的结果已经显示了真实的深度图。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

在Hypersim上进行深度补全。左:给予部分深度。中:深度估计从给定的部分深度。右:真值深度。

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!

7. 总结

DepthFM,一种用于单目深度估计的流匹配方法。通过学习输入图像和深度之间的直接映射,而不是将正态分布去噪为深度图,该方法明显比当前基于扩散的解决方案更高效,同时仍提供细粒度的深度图,而不会出现判别式范式的常见伪影。DepthFM使用预先训练好的图像扩散模型作为先验,有效地转移到了深度流匹配模型中。因此,DepthFM只在合成数据上进行了训练,但在推断期间仍然能很好地推广到自然图像。此外,辅助表面法线损失已被证明能改善深度估计。DepthFM的轻量级方法具有竞争力,速度快,并提供可靠的置信度估计。

对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1969

2024.08.16

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

37

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

37

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

19

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

16

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

6

2026.01.13

jQuery 正则表达式相关教程
jQuery 正则表达式相关教程

本专题整合了jQuery正则表达式相关教程大全,阅读专题下面的文章了解更多详细内容。

3

2026.01.13

交互式图表和动态图表教程汇总
交互式图表和动态图表教程汇总

本专题整合了交互式图表和动态图表的相关内容,阅读专题下面的文章了解更多详细内容。

45

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 4.5万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.2万人学习

Git 教程
Git 教程

共21课时 | 2.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号