首页 > 新闻 > IT新闻 > 正文

阿里国际发布并开源新一代多模态大模型 Ovis2

花韻仙語
发布: 2025-08-26 16:28:01
原创
736人浏览过

阿里国际正式推出全新升级的多模态大模型ovis2.5。这款模型专为原生分辨率视觉理解、复杂推理任务以及高性价比应用场景打造,展现出卓越的性能表现。根据opencompass主流多模态评测基准,ovis2.5在综合得分上较前代ovis2实现显著提升,并在同类开源模型中持续领跑,保持sota地位。

阿里国际发布并开源新一代多模态大模型 Ovis2

此次发布的开源版本包含两款:

  • Ovis2.5-9B:在OpenCompass上获得78.3的高分,力压多个参数量更大的模型,成为40B以下开源多模态模型中的性能冠军。
  • Ovis2.5-2B:以73.9的综合得分延续Ovis系列“小模型,强能力”的特色,在同规模模型中表现突出,特别适合部署于端侧设备或资源受限环境。

Ovis2整体架构示意如下:

阿里国际发布并开源新一代多模态大模型 Ovis2

百灵大模型
百灵大模型

蚂蚁集团自研的多模态AI大模型系列

百灵大模型 177
查看详情 百灵大模型

据官方介绍,Ovis2.5在模型架构、训练方法与数据构建三大维度实现了系统性优化与创新:

  • 架构设计:继承Ovis系列独特的结构化嵌入对齐机制。Ovis2.5由三大核心模块组成:支持动态分辨率的ViT用于高效视觉特征提取,Ovis视觉词表模块实现视觉与文本表征的精准对齐,最终由强大的Qwen3语言模型作为解码基座,完成多模态信息融合与自然语言生成。
  • 训练流程:采用精细化的五阶段训练策略,涵盖视觉预训练、多模态联合预训练、大规模指令微调,以及基于DPO、GRPO等算法的偏好对齐与推理能力增强。同时,通过多模态数据打包技术和混合并行优化,训练效率提升3-4倍。
  • 数据构建:相比Ovis2,训练数据量增加50%,重点强化视觉推理、图表理解、OCR识别与目标定位等关键能力。特别引入大量与Qwen3深度协同的“思考(thinking)”类合成数据,显著提升模型的自我反思与逻辑推理水平。

了解更多

代码地址:https://www.php.cn/link/0fa66dc7ac7cc66a4c72f28e7742f27f
模型下载: https://www.php.cn/link/d5e714549e9937f437d4fc2edf35b8fb
Ovis2.5-2B 模型: https://www.php.cn/link/d5e714549e9937f437d4fc2edf35b8fb
Ovis2.5-9B 在线体验: https://www.php.cn/link/614702957b7f03d0e9e4bcd2370c3a6d
Ovis2.5-2B 在线体验: https://www.php.cn/link/614702957b7f03d0e9e4bcd2370c3a6d
技术报告: https://www.php.cn/link/df17389413b21cab96900be63f2c7ec4

以上就是阿里国际发布并开源新一代多模态大模型 Ovis2的详细内容,更多请关注php中文网其它相关文章!

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号