0

0

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名

P粉084495128

P粉084495128

发布时间:2025-07-17 10:27:04

|

708人浏览过

|

来源于php中文网

原创

本文开源百度网盘AI大赛文档图像阴影消除参赛方案,基于IDR网络改进:底层加Non-Local模块,提升全局信息获取能力;特征通道增至96,增强学习能力。通过添加随机阴影等数据增强提升多样性,调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试,感谢相关支持,附各模型离线验证分数及代码相关说明。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘ai大赛:文档图像阴影消除参赛方案 ab榜第二名 - php中文网

百度网盘AI大赛:文档图像阴影消除参赛方案开源

本项目网络源自IDR网络:Self-Supervised Image Denoising via Iterative Data Refinement

论文链接:https://arxiv.org/abs/2111.14358

github:https://github.com/zhangyi-3/IDR

项目paddle实现源自:https://aistudio.baidu.com/aistudio/projectdetail/3439099?channelType=0&channel=0

1、简介

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

网络与UNET极为类似,用于去除噪音、摩尔纹等

DYng进行了以下改进:

  1. 在底层叠加了Non-Local模块,提高网络获取全局信息的能力。
  2. 把网络特征通道从48增加到96,提高网络的学习能力。

2、本方案在此基础上,进行了以下工作:

1、数据增强 借鉴原论文中的思路,对数据添加干扰,提升多样性

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

原图:

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

随机阴影、随机亮度、随机伽马

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

擦除和随机重组

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

百度网盘AI大赛:文档图像阴影消除参赛方案 AB榜第二名 - php中文网        

2、训练过程

训练过程中发现主要的ssim可达到99+,但psnr只有39+ 调整损失函数,原方案中损失函数为L1_loss+ssim_loss,替换为1-0.1*log10(pnsr)+ssim_loss作为损失函数。更换后,psnr达到40+。

3、大把时间踩的坑,留赠有缘人

思路1:更大的感受野,更大的卷积效果会更好,将下面三层卷积核由3调整至7

放弃原因:收敛速度变慢,模型由10M+变大到50M+,不够优雅

思路2:归一化,借鉴P2P网络,加入tanh、Instance Normalization等,加快收敛

放弃原因:图像中存在大量255值,0.5*(1+tanh)取值范围是(0,1),无法达到255,导致分数下降,Instance Normalization可能也有同样的问题,并未提高成绩

思路3:借鉴Range Scaling Global U-Net for Perceptual Image Enhancement on Mobile Devices,引入浅层特征,与最后输出层做乘运算

DeepL
DeepL

DeepL是一款强大的在线AI翻译工具,可以翻译31种不同语言的文本,并可以处理PDF、Word、PowerPoint等文档文件

下载

放弃原因:分数不升反降,留待研究突破

思路3:采用transformer编码方式重构网络

放弃原因:多次训练,pnsr无法突破30,为何分割、检测与分类都可提取到更好的信息,gan却不行,留待研究突破 模型一并开源()

4、与技术无关的总结

感谢百度举办比赛,感谢沈忱同学、朱静茹同学、秦登达同学、翟同学的支持 感谢aistudio平台DYng,FreFrankiesa开源的方案

已过而立之年,依然少年心性,任性且肆意妄为

于是被生活吊打

肺炎半年,仍未痊愈

毕业延期

家庭危机

教育责任

房贷压力

科研是一条需要独行的路,迷茫且孤独

奈何,我喜欢

要有情怀,迎难而上

要保持好奇,我们都是海边捡贝壳的孩子

要有光,我就是光

成绩复现

In [ ]
!unzip data/data129115/delight_testB_dataset.zip!python submit2.py
   

训练过程

In [ ]
# 准备训练数据与环境!unzip data/data128551/dataset_v3.zip!pip install scikit-image
   
In [ ]
# 开始训练!python train.py
   

代码与工作简要介绍:

  1. IDR 离线验证最高分70.08 0和1模型是第一批数据训练,2和3是第一批+补充数据训练,作为提交模型
  2. MBCNN 离线验证最高分 68.64 详见:https://aistudio.baidu.com/aistudio/projectdetail/3454475?contributionType=1
  3. IDR-RSG(思路三)离线验证最高分68.63 详见:modules/AIDR_arch-rsg.py
  4. transformer网络用于任务,离线验证最高分55.92,相当于完全失败
  5. IDR+ (思路一,卷积大小修改为7)离线验证最高分69.78(感觉还有潜力,但训练速度慢,模型大,有大显存卡可以试试)

相关专题

更多
Golang channel原理
Golang channel原理

本专题整合了Golang channel通信相关介绍,阅读专题下面的文章了解更多详细内容。

244

2025.11.14

golang channel相关教程
golang channel相关教程

本专题整合了golang处理channel相关教程,阅读专题下面的文章了解更多详细内容。

342

2025.11.17

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1969

2024.08.16

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

63

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

31

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

73

2026.01.13

MySQL数据库报错常见问题及解决方法大全
MySQL数据库报错常见问题及解决方法大全

本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

20

2026.01.13

PHP 文件上传
PHP 文件上传

本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

24

2026.01.13

PHP缓存策略教程大全
PHP缓存策略教程大全

本专题整合了PHP缓存相关教程,阅读专题下面的文章了解更多详细内容。

7

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号