讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

复旦大学与美团联合发布 R-HORIZON，长链推理评测框架

花韻仙語

发布： 2025-10-29 13:46:35

原创

303人浏览过

复旦大学携手美团longcat共同发布了 r-horizon——首个专注于系统性评估与提升大型推理模型（lrms）长链推理能力的评测框架与训练方法。

复旦大学与美团联合发布 R-HORIZON，长链推理评测框架

R-HORIZON 创新性地提出了“问题组合”（Query Composition）策略，通过在不同问题之间建立逻辑依赖关系，将原本独立的任务转化为复杂的多阶段推理流程。

以数学推理任务为例，该方法包含以下三个关键步骤：

信息提取：从原始问题中抽取关键数值、变量等核心要素
依赖构建：将前一个问题的解答结果作为后续问题的前提条件进行嵌入
链式求解：模型必须按顺序完成所有子任务，才能最终得出正确答案

核心优势：

灵活扩展：支持任意长度的推理链条（如 n=2, 4, 8...），便于测试模型极限
精准控制：可调节问题间的依赖强度，实现细粒度实验设计
高效低成本：基于现有公开数据集自动生成复杂推理样本，无需人工标注

基于这一机制，研究团队构建了 R-HORIZON Benchmark，用于全面评估 LRMs 在多步推理场景下的表现，并同步生成大规模长链推理训练数据。结合强化学习（RLVR）技术，显著提升了模型的深层推理能力。

小微助手

小微助手

微信推出的一款专注于提升桌面效率的助手型AI工具

小微助手

249

小微助手

复旦大学与美团联合发布 R-HORIZON，长链推理评测框架

R-HORIZON 方法流程示意图——从单一问题到多层依赖推理链的构建过程及应用方向

R-HORIZON 代表了大型推理模型研究范式的重大演进——不再局限于“能解决哪些问题”，而是深入探索“推理链条能延伸多远”。

主要技术贡献：

发布首个面向长链推理的综合性评测基准，揭示 LRMs 的三大关键瓶颈
提出可扩展的训练框架，提供低资源、高效益的能力增强路径
进行深入的机制分析，为下一代推理模型的设计提供理论支持与实践指导

论文标题： R-HORIZON: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? 论文链接： https://www.php.cn/link/5a7a6185f07dab689218c182fcf3b4ae 项目主页： https://www.php.cn/link/b62b2fca53f1466b2d09f6f05325e357 开源代码： https://www.php.cn/link/b9b1446d5dac7a83f7478d31f514dcf1 数据集地址：https://www.php.cn/link/f54fd264edeb6c5043be90f1570d4ea3

以上就是复旦大学与美团联合发布 R-HORIZON，长链推理评测框架的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git go github 美团 github https

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

美团

美团app是一款吃喝玩乐一应俱全的生活服务类软件，汇集团购、美食、酒店、外卖、电影、美发、美甲、KTV等服务于一体，为用户提供非常便利且全面的服务，有需要的小伙伴快来保存下载体验吧！

来源：php中文网

上一篇：英伟达宣布10亿美元战略投资诺基亚，共推AI-RAN与6G发展下一篇：颜值完胜日系同类！比亚迪纯电K-Car定名RACCO：明夏开售

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

首发全新徕卡1英寸主摄！小米17 Ultra上架预约

2025-12-18 12:47:12
渔网袜美女恐怖游戏《阈限点》愿望单破十万！明年初试玩

2025-12-18 12:50:02
毛子狂喜！《星球大战绝地：幸存者》俄语配音大更新

2025-12-18 12:51:16
小孩子顶不住！日本《街霸6》比赛女性角色泳装皮肤遭禁用

2025-12-18 13:03:02
《幻兽帕鲁》“心归之所”重大更新上线新增PVP功能并开放创意工坊

2025-12-18 13:08:14
拥抱 Spring Boot 4，重构 React 现代化仪表盘 | CoSky v5.2.0 发布

2025-12-18 13:16:03
日本航天局合作的月球游戏《REAL MOON》上线！曾扬言2025年建月球基地

2025-12-18 13:30:11
《怪物猎人：荒野》“祝谣之仪”介绍视频！全新装备武器

2025-12-18 13:31:28
《博德之门3》销量已破2000万！1年又卖500万份

2025-12-18 13:36:14
荣耀Magic8 Mini要来了！6.3英寸小直屏+天玑9500

2025-12-18 13:45:02

最新问题

谷歌仍是最大威胁！奥尔特曼坦言 OpenAI 将常态化 AI 红色警报 12月20日消息，OpenAI首席执行官山姆・奥尔特曼（SamAltman）在近期一次访谈中直言：即便手握雄厚资本与先发优势，谷歌（Google）依然是OpenAI“最严峻的对手”。在接受科技播客BigTechnology主持人AlexKantrowitz采访时，奥尔特曼强调，“适度的偏执”是科技企业持续生存的关键心态。他指出，一旦察觉潜在竞争压力浮现，必须立刻启动应对机制。他进一步透露，为巩固行业主导地位，OpenAI很可能在未来多年内，每年例行启动一至两次“红色警报（Cod

2025-12-20 18:07:02

574

写给小白的芯片封装入门科普之前给大家介绍了晶圆制备和芯片制造：晶圆是如何制造出来的？从入门到放弃，芯片的详细制造流程！从今天开始，我们聊聊芯片的封装和测试（通常简称“封测”）。这一部分，在行业里也被称为后道（BackEnd）工序，一般都是由OSAT封测厂（OutsourcedSemiconductorAssemblyandTest，外包半导体封装与测试）负责。█封装的目的先说封装。封装这个词，其实我们经常会听到。它主要是指把晶圆上的裸芯片（晶粒）变成最终成品芯片的过程。之所以要做封装，主要目的有两个。一个是对脆弱的

2025-12-20 16:54:23

513

沪渝蓉高铁武宜段即将开通，武汉至宜昌最快 1 小时可达 12月20日消息，中国铁路今日正式公布，沪渝蓉高铁武汉至宜昌段进入开通运营倒计时。据悉，该线路是国家“八纵八横”高速铁路网沿江通道的关键一环，线路自武汉市汉口站引出，途经天门市、荆门市，终至宜昌市宜昌北站，正线全长约313公里，设计时速350公里。项目通车后，将在江汉平原与鄂西山区之间构筑起一条高效便捷的高速客运走廊。全线共设汉口、汉川北、天门、京山南、钟祥南、荆门西、当阳西、宜昌北8座车站，其中汉口站为既有枢纽站，荆门西站为前期已启用的过渡性车站，其余均为全新建设车站。公开信息显示，沿江高铁武

2025-12-20 16:54:13

800

京港高铁南昌至九江段全线开始铺轨，通行将缩至半小时内感谢网友若怡提供的线索！12月19日消息，今日在京港高速铁路南昌至九江段（简称“昌九高铁”）尖山岭隧道铺轨作业现场，首对500米长钢轨顺利完成铺设并精准就位，这标志着昌九高铁全面迈入全线铺轨施工新阶段。据官方资料介绍，昌九高铁正线全长138公里，设计最高运营时速为350公里，全线共设庐山、庐山南、共青城东、昌北机场、南昌东等5座车站。项目包含桥梁58座、隧道21座，桥隧总占比达82%。整条线路需完成共计295.28公里的钢轨铺设任务。待铺轨工作全部完成后，工程将转入轨道精细调整及静态验收环节，为

2025-12-20 15:09:08

497

AI新十大建设硅光子AI生态链座谈会新竹登场行政院以「AI新十大建设」布局数位基础、关键技术与智慧应用，强化台湾在新一一代运算架构的竞争力。国家科学及技术委员会（国科会）今（19）日于新竹举办「台湾硅光子CPO-AI生态链座谈会」，聚集国内硅光子、共封装光学（Co-PackagedOptics，CPO）、半导体製造、先进封装、光电、网通与伺服器系统等领域的领导厂商及顶尖学研团队，共商下一代AI运算架构未来发展方向。总统赖清德亦亲自出席并表示，台湾完整的半导体、光电供应链基础，将有利于硅光子与CPO技术发展。赖清德致词

2025-12-20 14:10:02

643

果粉心碎？摺叠iPhone进度落后、良率成致命伤分析师曝「这时」入手才算稳知名天风国际证券分析师郭明錤（Ming-ChiKuo）近期在MacroMicroPodcast节目中，透露了苹果（Apple）折叠式iPhone的最新研发动态。据其透露，受制于初期制造良率偏低及产能爬坡（Ramp-up）进程缓慢等现实挑战，这款备受期待的折叠机型，预计要等到2027年才有望进入稳定量产与出货阶段。发布与上市或将错位重演「iPhoneX模式」郭明錤指出，尽管折叠iPhone的开发节奏略逊于先前预期，但苹果仍计划于2026年下半年举行正式发布会。不过，他同时强调，

2025-12-20 13:43:12

215

算力就是国力！国网中心推生成式AI平台TAIWAN AI RAP 国家实验研究院国家高速网络与计算中心正式推出「TAIWANAIRAP生成式人工智能应用开发服务平台」，旨在简化AI开发流程，打造企业及研发团队可即用、易上手的一站式开发环境，加速人工智慧技术在各产业的落地实践。国网中心指出，TAIWANAIRAP由中心自主研发，深度融合国家级高效能运算资源、弹性云端架构与符合机敏资料规范的安全储存机制，构建出整合算力调度、预训练模型调用与完整工具链支援的AI开发平台。其名称中「RAP」为「Resilientandhigh‑performanceAIPlat

2025-12-20 13:22:01

104

科幻电影《阿凡达 3》今日上映，豆瓣开分 7.6 为系列最低感谢网友啊俊、大哦东东东提供的线索！12月19日消息，万众期待的科幻巨制《阿凡达：火与烬》已于今日正式登陆全国院线，豆瓣评分也同步揭晓。数据显示，《阿凡达》第一部豆瓣评分为8.8分，《阿凡达：水之道》为7.8分，而此次上映的第三部《阿凡达：火与烬》评分为7.6分，创下该系列目前最低纪录：5星：24.7%4星：39.9%3星：28.1%2星：6.3%1星：1.0%本片由詹姆斯・卡梅隆再度掌镜，佐伊・索尔达娜、萨姆・沃辛顿等核心主演悉数回归。影片放映技术支持

2025-12-20 12:59:16

985

真人 GTA：美国男子凌晨偷飞机，还没起飞就撞上机库真人GTA上演现实版：美国男子凌晨潜入机场偷飞机，尚未升空便撞毁机库12月19日最新消息，据福克斯新闻数字频道报道，一架小型飞机于当地时间周四凌晨在洛杉矶某机场撞击并损毁一座建筑。洛杉矶机场警察局通报称，一名男子于凌晨4时许非法闯入机场设施，并擅自启动并操控了一架飞机。美国联邦航空管理局（FAA）确认，涉事机型为单引擎的塞斯纳C172，事故发生在当地时间凌晨5点左右，飞机在移动过程中猛烈撞上一座机库。执法机构已锁定嫌疑人身份——现年37岁的美国公民CeffearenoLogan，其因涉嫌非法侵入

2025-12-20 12:58:31

511

摺叠iPhone展开变身iPad mini？最新渲染图外流揭露超宽比例随着苹果（Apple）首款折叠设备预计于2026年底亮相，外界对其外观形态的热议持续升温。据德国科技媒体iPhone-Ticker.de近日公开的一组被指源自配件制造商的CAD设计图显示，iPhoneFold或将采用一种更宽、更紧凑的机身比例，其展开后的视觉体验与iPadmini高度趋近。放弃修长路线，主打「护照式」矮胖构型数据显示，iPhoneFold在折叠状态下单侧宽度为83.8毫米，高度为120.6毫米。相较iPhoneAir约74.7毫米的宽度，该机明显更宽、更矮，整体轮廓与其说是两台

2025-12-20 12:36:08

757

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

20527次学习
收藏
Git版本控制工具

14851次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部