首页 > 新闻 > IT新闻 > 正文

字节跳动发布开源多模态模型 Mini-o3

DDD
发布: 2025-09-11 16:25:05
原创
842人浏览过

字节跳动近日推出开源多模态模型 mini-o3,该模型通过增强推理模式和交互轮次,在视觉搜索任务中实现了在复杂场景下的显著性能提升。

字节跳动发布开源多模态模型 Mini-o3

https://www.php.cn/link/837e868ffbb3a67451e480e1864e071d

Mini-o3 是一款完全开源的多模态模型,专为“边看边思考”类型的视觉搜索任务打造。借助强化学习技术,模型可将工具调用扩展至数十轮交互,在多个权威评测基准——包括 VisualProbe、V* Bench、HR-Bench 和 MME-Realworld 上,取得了当前 7B 规模模型中的领先表现。

字节跳动发布开源多模态模型 Mini-o3

字节跳动发布开源多模态模型 Mini-o3

项目团队公开了完整的训练代码、模型权重,以及一个包含 4,500 条样本的 Visual Probe 数据集,允许研究者在非商业用途下复现类似 OpenAI o3 的深度推理行为。

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

豆包大模型 834
查看详情 豆包大模型

Mini-o3 支持深度优先搜索、试错探索等多种推理策略,测试阶段可将交互轮次扩展至 32 轮以上。随着交互次数增加,准确率明显上升——例如在 VisualProbe-Hard 任务中,准确率从初始的 35.1% 提升至 48.0%。

核心亮点

  • 高挑战性数据构建:发布 VisualProbe 数据集,涵盖高分辨率图像、微小目标物体及密集干扰项,迫使模型进行多轮视觉探索。
  • 迭代式数据采集:采用冷启动方式生成多样化的推理路径,覆盖回溯调整、假设验证等高级策略,弥补预训练模型在多轮交互上的能力短板。
  • Over-Turn Masking 机制:在强化学习训练中引入此策略,避免对超出预设轮次的响应进行惩罚,从而鼓励更深层次的探索行为。训练时设定最大轮次为 6,测试时可灵活扩展至 32 轮以上。

应用场景示例

字节跳动发布开源多模态模型 Mini-o3

以上就是字节跳动发布开源多模态模型 Mini-o3的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号