讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 硬件教程 > 硬件测评 > 正文

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

心靈之曲

发布： 2025-03-06 16:48:15

原创

641人浏览过

上海交大、上海ai lab和港中文大学的研究人员推出visual-rft（视觉强化微调）开源项目，该项目仅需少量数据即可显著提升视觉语言大模型（lvlm）性能。visual-rft巧妙地将deepseek-r1的基于规则奖励的强化学习方法与openai的强化微调（rft）范式相结合，成功地将这一方法从文本领域扩展到视觉领域。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

通过为视觉细分类、目标检测等任务设计相应的规则奖励，Visual-RFT克服了DeepSeek-R1方法仅限于文本、数学推理等领域的局限性，为LVLM训练提供了新的途径。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

Visual-RFT的优势：

与传统的视觉指令微调（SFT）方法相比，Visual-RFT具有以下显著优势：

少样本学习能力: 仅需10到1000条数据即可实现有效微调。
更强的泛化性: 在数据有限的场景下，性能优于SFT。

研究人员在多个视觉感知任务（检测、分类、定位等）上对Visual-RFT进行了验证，结果表明，即使在开放词汇和少样本学习的设定下，Visual-RFT也能取得显著的性能提升，轻松实现能力迁移。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

研究人员针对不同的任务设计了相应的可验证奖励：基于IoU的奖励用于检测和定位任务，基于分类正确性的奖励用于分类任务。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

在推理定位任务中，Visual-RFT展现出强大的视觉推理能力，例如，准确识别图片中运动员需要佩戴的防水眼镜。

HIX Translate

HIX Translate

由 ChatGPT 提供支持的智能AI翻译器

HIX Translate

114

HIX Translate

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

实验结果:

基于QWen2-VL 2B/7B模型进行的实验表明，Visual-RFT在开放目标检测、少样本检测、细粒度分类和推理定位任务上均优于SFT。即使是检测特定动漫角色（例如史莱姆），Visual-RFT也只需少量数据即可实现。

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

开源信息:

Visual-RFT项目已开源，包含训练、评测代码和数据。

项目地址：https://www.php.cn/link/b2c1a4c8e4f9c3f8efe19a903a005149

显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了

以上就是显著超越 SFT，o1/DeepSeek-R1 背后秘诀也能用于多模态大模型了的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git ai deepseek github https

大家都在看：

联想拯救者Y9000P 2025款体验：性能释放与笔记本的完美平衡，年度真香游戏本高级真我GT8 Pro评测：创意设计越级体验街拍神器天玑9500深度解析：性能颠覆体验重塑易简设计颜值在线 OPPO Find X9系列外观抢先看小米17 Pro系列上手评测对标苹果屏幕大突破

AI工具

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

来源：php中文网

上一篇：疑似 vivoS21mini 曝光 6.31 英寸小直屏 / 天玑 9300+ 处理器下一篇：外媒评出 MWC 2025 五大奇特智能手机传音占据三款

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

鸠摩搜索引擎入口

2025-12-15 12:48:08
大刀砍鬼子！国产抗日《斗虎》新实机东北战神来了

2025-12-15 12:57:01
《影之刃零》女角脸模章谨之：看到游戏形象很开心

2025-12-15 13:11:12
Windows 11什么配置才能爽玩游戏：微软给出官方答案

2025-12-15 13:15:11
两作全都拿到TGA最佳动作大奖！《哈迪斯2》官方发文致谢

2025-12-15 13:15:24
一加Turbo系列官宣李杰：同档性能、续航强得可怕

2025-12-15 13:39:07
新三国志曹操传马超无双试炼三通关攻略

2025-12-15 13:39:17
不安全不可靠！ voices38抨击虚拟机攻破D加密方法

2025-12-15 13:44:23
打对折！《天国：拯救2》Steam迎来新史低

2025-12-15 13:47:12
全新内存来了！性能秒杀DDR5/GDDR7

2025-12-15 14:04:28

最新问题

谷歌 Pixel 9 Pro 深度使用报告：原生安卓的魅力与计算摄影的极限 Pixel9Pro是以系统逻辑和算法思维重新定义“好用”的安卓旗舰，主打原生安卓流畅性、影像真实感与十年更新支持，虽在长焦夜景、兼容性等方面存在短板，但精准满足重视体验的用户需求。

2025-12-17 23:54:09

862

ROG MAXIMUS Z790 DARK HERO主板评测：为顶级超频与性能而生 ROGMAXIMUSZ790DARKHERO是专为压榨i9-14900K超频潜力打造的旗舰主板，具备20+1+2供电、全链路PCIe5.0、AI智能散热2.0、Wi-Fi7与双向AI降噪等顶配特性。

2025-12-17 23:53:14

662

西部数据WD_BLACK SN850X 4TB评测：PS5与PC的游戏加载速度终结者 WD_BLACKSN850X4TB是逼近PCIe4.0极限的PS5/高端PC游戏加速SSD，凭原厂主控+TLC颗粒+单面布局+自适应热管理实现加载提速、高随机读写与长期稳定。

2025-12-17 23:47:02

948

华硕 ROG ALLY 2 上手评测：掌机战争再升级，能否挑战Steam Deck霸主地位 ROGAlly2是系统性升级的掌机，聚焦安静、舒适、持久运行3A游戏。三档散热模式匹配不同场景，液态金属导热与自清洁风道优化静音与温控，Xbox式操控+ROG细节提升握持与响应，Windows生态与外接显卡协同体验优于SteamDeck。

2025-12-17 23:42:06

438

外媒分析：AI PC的NPU算力是刚需还是噱头？目前应用场景依然有限 NPU算力真实价值体现在语音识别、图像处理、本地大模型推理及多模态工作流四方面：30TOPS以下错误率升至17%，50TOPS可降GPU占用41%，20TOPS支撑7B模型9.3token/s，35TOPs以下多任务失败率达64%。

2025-12-17 23:39:30

813

小米15 Pro深度解析：徕卡影像再突破，搭载骁龙8 Gen 4性能实测小米15Pro以徕卡Summiluxf/1.44主摄、骁龙8Gen4和全焦段三摄实现影像质变：光圈可变控光、18-bitISP实时处理、AI星轨堆栈及直出优化，专业能力全面下放。

2025-12-17 23:35:02

664

小米MIX Fold 4配置曝光：更薄的机身与潜望长焦的首次加入小米MIXFold4首次在大折叠机中搭载徕卡全焦段四摄与潜望长焦，整机厚仅4.59mm（展开）/9.47mm（折叠），重226g，配备龙骨转轴2.0与碳纤维架构，支持IPX8防水及双向卫星通信。

2025-12-17 23:25:32

986

DRAM内存价格或将持续上涨：三大厂商削减产能影响显现 DRAM内存价格持续上涨且短期难回落，主因三大厂商将消费级产能转向AI专用内存（如HBM、DDR5RDIMM），因其毛利率达50%–70%，是普通内存的2–3倍。

2025-12-17 23:23:32

464

英特尔酷睿Ultra 9 185H笔记本横评：AI PC元年，谁是真正的全能先锋酷睿Ultra9185H是当前AIPC元年中少数实现CPU、GPU、NPU三者协同落地的移动处理器，在办公、轻创作、本地AI及低功耗游戏场景具代际优势；16核22线程、30MB缓存、5.4GHz睿频，R23多核16000–24000分、单核1813分，NPUFloat16达279，锐炫核显TimeSpy3469，支持14.5英寸高刷高色域屏，整机1.4–1.6kg，双烤130W，接口丰富，适合移动设计师、研究生、商务人士及学生党。

2025-12-17 22:54:08

784

华硕 ROG ZEPHYRUS G16 2024款评测：星云屏下的轻薄性能猛兽华硕ROGZephyrusG162024款是兼顾高负载、高画质与高便携的旗舰级全能本，搭载2.5K/240Hz星云屏、RyzenAI9HX370或Ultra9185H+RTX4070/4080/4090，重1.85kg、厚17.2mm，性能释放稳、接口丰富、做工扎实。

2025-12-17 22:42:38

524

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Django 教程

21819次学习
收藏
Go 教程

25746次学习
收藏
TypeScript 教程

15456次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部