微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 新闻 > IT新闻 > 正文

阿里千问登顶空间推理全球榜首，超越Gemini 3与GPT-5.1

P粉602998670

发布： 2025-11-26 16:21:31

原创

151人浏览过

近日，在衡量多模态模型空间推理能力的关键基准测试spatialbench的最新榜单中，来自阿里巴巴的视觉理解模型取得了瞩目的成绩。其旗下的千问qwen3-vl和qwen2.5-vl模型，成功包揽了榜单的前两名，其表现超越了包括谷歌 gemini 3、openai gpt-5.1以及claude sonnet 4.5在内的所有国际顶尖模型。

具体的榜单数据显示，千问Qwen3-VL-235B和Qwen2.5-VL-72B的得分分别为13.5分和12.9分，而作为对比，Gemini 3.0 Pro的得分为9.6分，GPT-5.1为7.5分。不过，榜单也指出，目前所有AI大模型的整体表现，距离能够专业处理复杂空间推理任务的人类基准线（约80分）仍有较大差距。

阿里千问登顶空间推理全球榜首，超越Gemini 3与GPT-5.1 - php中文网

据了解，作为阿里在2025年最新开源的新一代视觉理解模型，Qwen3-VL在视觉感知和多模态推理方面实现了重大突破。它不仅可以调用抠图、搜索等外部工具，来完成复杂的“带图推理”任务，甚至可以仅凭借一张设计草图或一段游戏视频，直接进行“视觉编程”。

INFINITE ALBUM

INFINITE ALBUM

面向游戏玩家的生成式AI音乐

INFINITE ALBUM

144

INFINITE ALBUM

同时，Qwen3-VL还专门增强了其3D检测能力，能够更好地感知空间关系，这使得机器人在判断物体方位、视角变化等方面，能够实现更精准的操作。目前，Qwen3-VL已开源了从2B到235B MoE等多个不同参数规模的版本，并已上线至千问App，供所有用户免费体验。

SpatialBench作为近年来新兴的第三方基准测试，其主要聚焦于多模态模型在空间、结构、路径等方面的综合推理能力，被AI社区视为是衡量“具身智能”发展水平的新兴标准之一。

以上就是阿里千问登顶空间推理全球榜首，超越Gemini 3与GPT-5.1的详细内容，更多请关注php中文网其它相关文章！

相关标签：

app 谷歌工具 ai openai gpt gpt-5 claude 大模型阿里巴巴 ai大模型 gemini gpt AI大模型

大家都在看：

OverDrive 起诉 OpenAI： Sora 商标撞名，索赔与禁令请求已递交阿里宣布“千问” App 开启公测：用最强模型打造最佳个人 AI 助手夸克上线千问助手，使用阿里 Qwen 最强大模型阿里千问团队谈“对标 ChatGPT”：希望他们没有的能力我们有大麦娱乐推出全新品牌“大麦国际”：提供全球演出购票，接入支付宝网络

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：SpatialBench 榜单更新：阿里千问霸榜前二，超越 Gemini3、GPT5.1 下一篇：没有了

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

百度浏览器网页背景显示异常怎么办百度浏览器页面背景显示修复方法

2025-11-03 10:03:33
在Java中如何理解继承与多态的关系_Java继承多态应用技巧

2025-11-03 10:05:22
如何在CSS中实现响应式导航栏布局_Flex与Grid结合应用

2025-11-03 10:10:02
Safari浏览器网页显示异常怎么办 Safari浏览器页面布局错乱修复方法

2025-11-03 10:11:06
俄罗斯浏览器Яндекс中文版入口 Яндекс官方网页版登录地址

2025-11-03 10:16:20
美团外卖双十一优惠券入口在哪详细教程

2025-11-03 10:17:02
如何在Golang中实现容器健康检查逻辑

2025-11-03 10:17:17
如何在Golang中实现Web接口统一返回结构

2025-11-03 10:19:21
夸克浏览器下载任务无法暂停怎么办夸克浏览器下载控制方法

2025-11-03 10:21:02
微信聊天记录无法导出怎么办微信聊天导出与备份方法

2025-11-03 10:21:47

最新问题

Xmake v3.0.5 发布：多行进度输出、XML 模块、异步 OS API 和 Swift 互操作新特性介绍新版本中，我们引入了多个重要特性，显著提升了开发体验。重点包括多行进度输出（支持主题配置，提供更好的构建可见性）、全面的XML模块（用于解析和编码XML数据）、异步OSAPI（提升I/O性能）以及Swif

2025-11-26 15:58:02

585

Git 3.0 默认主分支将从“master”改为“main” 最新发布的Git2.52版本在其更新日志中悄然加入了一条看似微小却影响深远的说明：自Git3.0起，若无额外配置，“gitinit”命令将默认创建名为‘main’的初始分支，取代原先的‘master’。这意味着，当Git3.0正式发布后，开发者在执行gitinit初始化新仓库时——只要未进行自定义设置——系统将自动生成名为main的主分支，而非沿用多年的master。这一变更并非临时起意，而是开源社区长期推动的结果。早在2020年，SoftwareFreedomCo

2025-11-26 15:40:11

122

Pebble 智能手表软件正式“全量开源” Pebble创始人EricMigicovsky宣布：Pebble智能手表的核心软件已实现完全开源，涵盖手表固件与配套移动应用。现在用户可以自由下载、编译并运行全部所需程序，从而实现对手表的长期使用或自主维护。?三大核心模块全面开源PebbleOS（设备端操作系统）：自今年1月起已完全开放源代码，后续所有更新和改进也将持续公开。移动端伴侣应用（iOS/Android）：全新开源的应用程序现已发布，解决了此前官方服务终止后只能依赖旧版侧载的问题，确保未来可持续维护。开发工具&Peb

2025-11-26 15:25:01

312

字节跳动 TRAE SOLO 模式中国版正式上线字节跳动旗下AI编程助手TRAE宣布，其重磅功能SOLO模式正式登陆中国区平台，并即日起面向所有用户全面开放，且无需付费即可使用。自今年3月推出中国版以来，TRAE已收获超百万月活跃用户，累计生成并被采纳的代码行数突破60亿行。作为TRAE2.0的核心模块，SOLO模式基于“ContextEngineering”（上下文工程）理念构建，能够融合多模态输入信息——包括产品需求文档、技术规范、代码库及网页链接等，实现需求理解、任务拆解、工具调用与执行反馈闭环，真正达成从原始需求到部署上线的端到端自动

2025-11-26 15:09:01

227

软件授权管理系统 v1.0.2 发布软件授权管理系统：将软件从一次性销售模式升级为可持续运营的数字资产，不仅优化客户使用体验，还助力企业实现长期收益增长。✨新增功能官方文档直达入口：新增链接跳转至官方文档，便于用户快速获取帮助信息许可证文件导出：支持用户自主下载对应的许可证文件，提升操作便捷性授权文件导出：允许用户下载授权配置文件，增强使用灵活性?优化与改进仪表板授权趋势图表：修复Y轴数值显示异常问题，确保数据可视化更准确官方首页：LicenseManagerlicense-manager：这是一款独立部署的软件授权管

2025-11-26 14:34:14

725

OSC 社区新板块介绍 —— 智写平台 “OSC·智写平台”正式上线，搭载前沿AI技术，打造高效智能的在线写作助手，助力每位用户轻松驾驭AI工具，实现内容创作的提质增效。接下来，带你全面解锁智写平台的强大功能。在原有博客撰写基础上，平台全新推出“AI续写/优化/校对/翻译”四大能力。无论是灵感枯竭还是追求更优表达，AI助手都能即时响应，为你的创作保驾护航。智写平台聚焦多场景内容生成，只需输入关键词或简要描述，即可快速产出高质量文本。覆盖技术博文、营销文案、工作总结等多种类型，精准匹配不同用户的实际需求。平台功能主要分为以下四大模块：

2025-11-26 14:31:52

858

软银集团完成收购半导体设计公司 Ampere Computing 软银集团（“SBG”）宣布，其子公司SilverBands6(US)Corp.已于2025年11月25日（美国时间）正式完成对美国半导体设计企业AmpereComputingHoldingsLLC（“Ampere”）全部股权的收购（“本次交易”）。自此，Ampere成为SBG的全资附属公司。从收购完成之日起，Ampere的财务数据及运营成果将并入SBG的合并财务报表中。目前，SBG正在评估此次交易对其整体合并业绩的具体影响。若后续存在需披露的信息，公司将依照相关规定及时公

2025-11-26 14:27:02

245

Grok5 将在 2026 年公开挑战《英雄联盟》顶级职业战队 xAI公司于周二正式公布，计划在2026年推出的超大规模模型Grok5将向全球顶尖《英雄联盟》（LoL）职业战队发出公开挑战。据xAI透露，Grok5将与包括2025年全球总决赛冠军队伍T1在内的多支世界顶级战队展开多场Bo系列赛。为确保比赛的公平性与技术验证的严谨性，该AI模型将遵循严格的“人类等效限制”规则：视觉输入：仅能通过模拟标准人类视力（20/20）的摄像头获取游戏画面信息。操作响应：反应速度和操作频率将被限制在人类平均能力范围内。数据权限：不得接入外部数据接口或使用超越

2025-11-26 13:39:06

393

惠普拟裁员 6000 人，未来将加大 AI 工具应用惠普公司近日宣布将裁员4000至6000人，以应对2025财年利润未能达到市场预期的挑战。CEO恩里克・洛雷斯在采访中透露，此次重组计划将持续至2028财年，预计每年可为公司节省约10亿美元运营成本。为实现效率提升，惠普将在产品开发、客户支持、销售及生产等多个环节加大人工智能（AI）工具的应用力度。洛雷斯表示，“降本增效”是保持企业竞争力的关键举措。此次裁员将产生约6.5亿美元的重组费用，其中约2.5亿美元将在2026财年内支出。截至2024年10月，惠普全球员工总数约为58000人。值得注意的

2025-11-26 12:37:38

814

IvorySQL 5.0 发布：基于 PG 18.0 亲爱的IvorySQL开源社区成员们，大家好！今天我们满怀激动地向大家正式宣布：IvorySQL5.0版本重磅上线！此次发布的IvorySQL5.0全面基于PostgreSQL18.0进行重构升级，在Oracle兼容性方面实现全新突破，生态组件集成能力进一步增强，深度拥抱云原生架构。配合全平台安装包与便捷的在线体验功能，让数据库使用更加简单高效。基于PostgreSQL18.0PostgreSQL18.0带来多项核心优化：引入异步IO（AIO）机制，显著提升顺序扫描、位图

2025-11-26 12:19:48

989

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Java 教程

226171次学习
收藏
国外Web开发全栈课程全集

8836次学习
收藏
全栈式APP开发进阶教程（前端uniapp+后端ThinkPHP框架）

9641次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部