讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

美团 LongCat 发布 UNO-Bench，统一的多模态模型基准测试

碧海醫心

发布： 2025-11-06 14:19:02

原创

1154人浏览过

美团longcat团队发布了uno-bench，这是一个用于评估多模态大语言模型统一能力的综合性基准测试。

该基准致力于系统化衡量模型在单模态与全模态理解方面的表现，覆盖44种任务类型以及5种不同的模态组合，并通过实验揭示了全模态性能与单模态能力之间的组合规律。

美团 LongCat 发布 UNO-Bench，统一的多模态模型基准测试

据悉，UNO-Bench包含1250个经过人工精心筛选的全模态样本（跨模态可解性高达98%）和2480个增强型单模态样本。其中，人工构建的数据集更贴近真实应用场景，尤其适用于中文环境；而自动压缩版本则提升了90%的运行效率，在保持与原始数据一致性的前提下，在18项公开基准上实现了98%的结果一致性。除了传统选择题外，团队还提出了一种新颖的多步骤开放式问题形式，以评估模型在复杂推理任务中的表现。这一形式结合了一个通用评分模型，支持对6类题型进行自动化评估，准确率高达95%。

美团 LongCat 发布 UNO-Bench，统一的多模态模型基准测试

腾讯智影

腾讯智影

腾讯推出的在线智能视频创作平台

腾讯智影

341

腾讯智影

目前，UNO-Bench主要聚焦于中文场景，团队正积极寻求合作，推动英语及多语言版本的开发。UNO-Bench数据集已发布于Hugging Face平台，相关代码、论文及项目详情均已开源。

https://www.php.cn/link/455c8959885c1b38871319571e9ab72c
https://www.php.cn/link/36a213dec58f9ae20b81cd14d3358981
https://www.php.cn/link/db17bc578c383f5bb0cb9be70c42331c

以上就是美团 LongCat 发布 UNO-Bench，统一的多模态模型基准测试的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git github 美团多语言 github https 自动化

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

美团

美团app是一款吃喝玩乐一应俱全的生活服务类软件，汇集团购、美食、酒店、外卖、电影、美发、美甲、KTV等服务于一体，为用户提供非常便利且全面的服务，有需要的小伙伴快来保存下载体验吧！

来源：php中文网

上一篇：Vitess 23.0.0 发布下一篇：苹果计划每年支付 10 亿美元给谷歌，以升级 Siri 语音助手

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

卡通风格冒险新作《暗途：梅尔王遇刺案》现已发售

2025-12-21 12:20:03
Epic喜加一！免费领取复古潜行FPS游戏《浴血西部》

2025-12-21 12:21:08
顺丰无人机飞越琼州海峡，物流时效从“小时级”迈向“分钟级”

2025-12-21 12:38:01
《Arc Raiders》向所有玩家免费发放1000枚游戏币

2025-12-21 12:44:05
到手屠龙刀！央视曝光手机回收平台藏猫腻：高价预估低价收购

2025-12-21 12:55:01
小米手机相册编辑确定月底升级！呼声最高的功能要来了

2025-12-21 13:00:02
《星际：异端先知》开发者给尼尔"拍马屁"：真的非常出色

2025-12-21 13:08:02
Steam喜加一：神似《传说之下》风格的清版射击！

2025-12-21 13:29:12
一半是汽油一半是手机，深圳海关查获油箱暗格藏匿旧手机进境案

2025-12-21 13:39:01
13块的《底特律》别买！打开是豆包：引发网友热议

2025-12-21 14:00:31

最新问题

全国首个开放式机器人租赁平台“擎天租”发布全国首个开放式的机器人租赁平台“擎天租”近日在上海正式上线。截至目前，“擎天租”已完成在全国50个重点城市的布局，并整合了逾600家专业服务合作伙伴。平台汇聚多品牌、全品类机器人产品，月租价格区间宽泛——从200元起的轻量级家用机型，到万元级的高性能工业协作机器人一应俱全，全面覆盖家庭陪伴、商业导览及智能制造等多样化应用场景。用户仅需通过微信小程序或官方商城即可完成选型、签约与租赁全流程，操作便捷高效。按照平台公布的拓展路径，至2026年，“擎天租”服务网络将延伸至全国超200个城市，持续强化下

2025-12-22 19:13:02

875

苹果携手普渡大学研发 DarkDiff 技术，极暗环境下也能拍出“夜视仪”级大片 Apple与普渡大学的研究团队联合推出了一项名为DarkDiff的前沿影像技术，专为攻克智能手机在极低光照条件下成像质量差——如噪点密集、纹理丢失、细节模糊等难题而生。该方案创造性地将生成式扩散模型深度集成至相机的图像信号处理（ISP）链路中，使移动设备在近乎全黑的场景下也能输出清晰、真实、富含细节的照片。目前主流的夜景模式多依赖拍摄完成后的算法降噪，但这类后处理方式容易造成画面失真，例如出现类似油画笔触的伪影或大面积细节被“抹平”的现象。DarkDiff的核心突破在于：AI不再仅作为后期补救工

2025-12-22 18:55:02

810

英伟达开源 NitroGen，统一的视觉到行动模型英伟达研究团队近日正式对外开源了全新基础模型——NitroGen。据官方介绍，NitroGen是一款统一的“视觉到动作”模型，能够直接从原始游戏画面帧中理解内容并实时输出对应的手柄操作指令，实现端到端的游戏交互。该模型以“玩游戏”为根本训练目标，覆盖范围极为广泛，涵盖《巫师3：狂猎》《赛博朋克2077》等在内的1000余款游戏，类型横跨RPG、竞速、大逃杀（吃鸡）、2D平台及3D开放世界等多种游戏形态。NitroGen的研发初衷并非单纯追求更高胜率或更优游戏表现的“AI玩家”，而是致力于探索一种

2025-12-22 18:45:02

581

开源中国入选「2025 年度中国信创软件高质量发展百强企业」近日，中国软件行业协会正式发布《2025中国信创软件高质量发展报告》，同步揭晓「2025年度中国信创软件高质量发展百强企业名录」。北京奥思研工智能科技有限公司（即开源中国）荣登榜单，获评信创软件领域高质量发展的标杆企业之一。2025年正值国家“十四五”规划收官之年，信创产业正加速由“安全可控”阶段迈向以“价值创造”为核心的新发展阶段。作为国产数字化底座的关键支撑力量，信创软件企业的提质增效已成为推进数字中国战略落地的重要引擎。本次遴选严格依据《信创软件企业高质量发展评估标准》（T/SIA060—

2025-12-22 18:36:21

413

Anna’s Archive 宣布完成 Spotify 大规模备份知名盗版资源平台Anna’sArchive近日对外披露，已对Spotify全站内容实施大规模数据存档工作，旨在打造一个面向长期存续的音乐数字档案库，以防范因版权变动、曲目下架或平台停运等原因导致的音乐资源永久性丢失。据其官方披露的信息显示，本次归档几乎完整抓取了Spotify的全部曲目元数据，涵盖曲名、艺人、专辑、发行时间、时长、流派等关键字段，总量逾2.5亿条，与Spotify当前公开曲库规模高度吻合。此外，项目同步捕获约8600万首可播放音频文件，原始数据体积达300TB

2025-12-22 18:36:10

170

商务部国际贸易谈判代表兼副部长李成钢会见苹果首席运营官萨比赫・汗感谢网友啊俊的线索提供！12月22日消息，据商务部官网今日发布的信息，12月19日，商务部国际贸易谈判代表兼副部长李成钢与美国苹果公司首席运营官萨比赫·汗举行会见。双方围绕苹果公司在华业务拓展、合作深化等议题展开务实交流。李成钢指出，苹果公司与中国市场的协作关系，本质上是彼此赋能、协同进化的典范。“十五五”期间，中国将持续推进制度型开放，优化营商环境，进一步提升市场准入透明度与政策稳定性，这将为苹果等全球领先企业创造更广阔的发展空间。他期待苹果公司继续强化在华产业链布局，深化与本土企业在技术、制

2025-12-22 18:20:02

526

Sam Altman 谈 OpenAI 的“取胜路线”：产品、个性化与基础设施三线并进在最近与BigTechnology的对话中，OpenAI首席执行官SamAltman全面阐释了公司在当前AI竞争浪潮中的战略框架：聚焦产品体验升级、加码底层基础设施建设，并加速推进AI个性化能力的实际落地，以此构筑可持续的竞争壁垒。Altman透露，OpenAI内部已建立一套高度敏感的响应机制——在面临重大外部挑战时（如竞对发布突破性模型或市场格局突变），将立即启动代号为“CodeRed”的应急评估流程，快速研判局势，并动态优化模型迭代路径、产品功能节奏及上线策略，以灵活应对来

2025-12-22 18:19:02

292

民航局发布两项无人机强制性国家标准，规范实名登记激活、运行识别等 12月22日消息，中国民用航空局今日正式发布通知：由其牵头编制的《民用无人驾驶航空器实名登记和激活要求》《民用无人驾驶航空器系统运行识别规范》两项标准，已获国家市场监督管理总局（国家标准化管理委员会）批准，作为强制性国家标准予以发布。上述标准将于2026年5月1日起全面施行，旨在推动无人机产业实现更高质量、更可持续、更安全可控的发展。根据民航局发布的《2024年民航行业发展统计公报》，截至2024年底，全国已取得无人机运行合格资质的运营单位接近2万家，完成注册登记的民用无人机总

2025-12-22 18:00:22

680

可扩产空间成“香饽饽”：消息称美光亦有意力积电铜锣厂区 12月22日消息，据台媒《经济日报》最新披露，继此前传出闪迪有意接洽之后，美光亦已将目光投向力积电（力晶积成、PSMC）位于苗栗县铜锣科学园区的全新晶圆制造基地，拟通过合作方式快速扩充自身存储芯片产能。该铜锣厂区规划月产能达4万至5万片晶圆，而现阶段设备装机率仅约两成，具备显著的产能释放空间。对存储大厂而言，直接进驻已具备基础建设条件的铜锣厂，可大幅跳过土地购置、厂房新建、无尘室搭建等耗时数年的前期环节，从而更敏捷响应当前供不应求的市场态势。▲力积电晶圆厂分布据知情人士透露，双方目前正围绕三种潜

2025-12-22 17:55:00

215

北京人形开源国内首个国标 VLA 大模型 XR-1 北京人形机器人创新中心正式开源具身智能视觉-语言-动作（VLA）大模型XR-1。该模型是国内首个、同时也是当前唯一通过国家具身智能标准测试的VLA大模型。本次开源内容涵盖XR-1大模型本体，并同步推出高性能数据底座RoboMIND2.0与高精度数字资产数据集ArtVIP最新版本。作为具身智能系统的“小脑”，XR-1具备跨硬件平台运行能力，可无缝适配天工2.0、UR系列、FrankaEmika等多种主流机器人本体，实现通用操作知识的跨平台迁移。基于自研超百万级多本体交互数据，XR-1在颜色识别、空

2025-12-22 17:16:02

933

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

21061次学习
收藏
Git版本控制工具

14893次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部