文章专题 AI工具学习下载问答源码最近更新

PHP

会员中心讲师中心微信公众号

首页 > 科技周边 > 人工智能 > 正文

推动大模型自我进化，北理工推出「流星雨计划」

聖光之護

发布： 2024-12-05 12:45:01

原创

480人浏览过

北京理工大学计算机科学与技术学院的direct lab启动了“流星雨”研究计划，旨在探索大模型的自我进化理论与方法。该计划的核心思想源于人类个体能力提升的模式：在掌握基本技能后，通过与环境及自身的交互，不断学习和改进。本文将重点介绍该计划在代码大模型和垂域大模型进化方面的成果。

SRA-MCTS：赋能代码大模型自我进化

论文标题: SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Search for Code Generation
论文地址: https://www.php.cn/link/a598e7d200bf02558d5534839884b7a3
代码开源: https://www.php.cn/link/c9de64b0aa92114521bfc07918df7b47
8B 模型数据开源: https://www.php.cn/link/b23f2a9eddbae15529dc68d16d4d4c9c

为提升代码大模型的性能，研究人员提出了SRA-MCTS方法。该方法的核心在于让模型无需外部监督信号，自主生成推理路径并转化为代码。通过自我迭代，模型能够生成更高质量的推理路径，从而提升处理复杂问题的成功率。实验结果表明，即使是小规模模型，SRA-MCTS也能显著提升其性能，尤其在处理多样化和复杂问题方面。

SRA-MCTS 的主要贡献：

无监督学习: 无需人工标注数据或额外监督。
持续自我提升: 通过自我训练形成正反馈循环，持续改进性能。
增强复杂问题解决能力: 在不同规模模型上均取得显著性能提升。
小模型自我合成潜力: 小模型(2B, 8B, 14B)自我合成数据训练效果超越大模型数据蒸馏。

SRA-MCTS 的工作机制:

SRA-MCTS 通过结合推理过程和数据生成，引导模型自主生成推理路径。该方法包含四个阶段：选择、扩展、评估与反思、反向传播。通过反复迭代，模型不断完善其推理能力。

示例：拓扑排序代码生成

（此处保留原文中关于拓扑排序的示例代码和解释）

流星雨计划：垂域大模型的自我进化框架

论文: https://www.php.cn/link/5cbd8331fac120a295879dc62b0d10ed
Github: https://www.php.cn/link/94bd3f4d79c60af8831740e58a68dd6e

“流星雨”计划提出一个“弱到强”的进化框架，包含三个阶段：

导师监督学习: 利用知识蒸馏，但采用“弱到强”的策略，让强模型根据弱模型的指导生成领域数据，从而减少认知偏差。
自我评估能力习得: 借鉴StaR方法，利用更强的模型（如GPT-4）提供反馈，迭代训练模型，提升其自我纠错能力。
自我提升训练: 通过对比学习（例如，beam search vs. greedy search），让模型向更高效的推理策略靠拢，实现完全的自我进化。

性能分析及未来展望:

实验结果表明，应用Meteor进化方法后，LLaMA3-8B-Instruct和Qwen2-7B-Instruct在准确性、完整性等方面均有提升。未来，研究团队将继续改进各个阶段的进化方法，并拓展Meteor的应用场景。 DIRECT LAB 欢迎更多研究者参与合作，共同推动大模型自我进化领域的发展。（代码和数据已公开：https://www.php.cn/link/201ecef3255bae210a1b2c0ae4a21c7a）

以上就是推动大模型自我进化，北理工推出「流星雨计划」的详细内容，更多请关注php中文网其它相关文章！

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

相关标签：

git for 循环 github https gpt llama

来源：php中文网

上一篇：隆利科技：车载显示产品已应用于小鹏MONA M03中控屏上下一篇：马来西亚“硅岛”槟城将开设IC设计与数字园区

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

豆包AI办公神器电脑端免费下载-2025官方最新版PDF翻译总结一键搞定豆包AI办公神器电脑端下载后无法使用，可依次检查软件、电脑环境及账号问题。首先重新下载安装官方最新版本并验证文件完整性；其次确认是否缺少运行库或被防火墙拦截；再者检查账号登录状态及权限。若上述方法无效，建议联系官方客服寻求帮助。豆包AI的PDF翻译功能适合日常办公快速翻译，但准确性不及专业软件，缺乏自定义选项。其优势在于操作便捷、集成多项办公功能且成本较低。如需高质量翻译，推荐使用专业软件。使用豆包AI的PDF总结功能时，应明确目标、筛选补充关键信息、结合其他功能协同办公、选择清晰文档以提高识别

2025-06-21 17:00:02

164

豆包AI如何开发插件豆包AI插件开发方法豆包AI插件开发并不复杂，关键在于理解其机制和接口规范。首先注册开发者账号并获取API密钥；其次了解插件类型如工具类、内容类、交互类等；接着阅读官方文档作为开发基础；建议从“HelloWorld”开始练手。插件结构主要包括manifest.json（基本信息）、前端界面（可选）、后台逻辑（可选）及权限声明。调试时可在沙盒环境运行测试，使用测试账号验证功能，最终提交审核上线。开发过程中需持续关注用户反馈，及时更新维护版本。

2025-06-21 16:54:02

271

长鑫存储DDR5市场份额预计年底达7% 中国存储芯片制造商长鑫科技（CXMT）预计，今年其DRAM出货量将同比增长约50%，在整体DRAM市场中的出货份额预计将从第一季度的6%上升至第四季度的8%。除了在DDR4和LPDDR4等传统优势产品上扩大产能之外，长鑫在新一代DDR5和LPDDR5产品方面也取得了显著进展。据Counterpoint预测，该公司在DDR5市场的份额将从第一季度的不足1%增长到年底的7%，而LPDDR5的市场份额也将由0.5%跃升至9%。根据TrendForce最新发布的报告，中国厂商在今年第三季度DRAM与NA

2025-06-21 16:24:12

549

多品牌充电宝或电芯3C证书被暂停根据国家市场监管总局全国认证认可信息公共服务平台显示，知名电池制造商安普瑞斯(无锡)有限公司旗下多个电池及电芯产品的3C认证证书已被“暂停”。与此同时，包括罗马仕、安克创新、倍思、绿联在内的多个移动电源品牌也出现了3C认证证书被暂停的情况。依据3C认证的相关规定，当产品存在严重安全风险（如起火隐患）或在监督抽查中未达标时，相关认证机构有权暂停其认证资格。此次事件中，移动电源存在的自燃问题已明显违反《消费品召回管理暂行规定》以及《锂离子电池安全要求》（GB31241-2022）等强制性国家标准。例

2025-06-21 15:40:25

919

丰田汽车在日销量复苏 5月销量达9.95万份额高达30.7% 据“芝能科技”消息，2025年5月，日本新车市场继续保持稳步上升趋势，当月新车销量同比增长3.7%，达到324,064辆。今年前五个月总销量接近195万辆，同比增幅达11.3%。在整体向好的市场环境下，丰田汽车表现尤为突出。数据显示，丰田5月份销量为99,500辆，同比增长4.4%，市场份额高达30.7%，继续在日本国内市场保持领先地位。旗下多款车型表现出色，其中小型SUVRaize销量猛增至8,867辆，同比增长超过200%，成为本月增长最快的车型之一。此外，Roomy也实现64.4%的同比增

2025-06-21 15:36:11

994

打工人必备：豆包AI/Copilot提升Excel/PPT效率的10个场景豆包AI和Copilot均能有效提升办公效率，具体使用需根据需求选择。1.豆包AI擅长自然语言处理，适合个性化复杂任务，如Excel数据清洗、公式生成、PPT大纲创建及内容润色；2.Copilot侧重自动化操作，适合重复性工作，如Excel数据填充、图表推荐、PPT一键生成与设计优化；3.若需高效完成基础任务，优先选Copilot，若需灵活处理个性化需求，优先选豆包AI；4.实际应用中可根据不同场景交替使用两者，以实现最佳效率提升效果。

2025-06-21 15:30:02

603

乘联分会：6月狭义乘用车零售预计200万辆新能源预计110万辆 6月20日，乘联分会发布消息表示，进入6月以来，各大厂商纷纷加大促销力度以冲刺季度和半年度销售目标，从而直接推动终端销量增长。根据最新调研数据，6月中旬整体车市的折扣率约为24.8%。占据市场八成以上零售份额的头部厂商本月零售目标同比去年5月增长15%，较上月提升约4%。综合估算，6月狭义乘用车零售总量预计为200万辆左右，同比增长13.4%，环比增长3.2%。其中新能源车型零售量预计可达110万辆，渗透率回升至55%左右。在具体周度表现方面，受端午假期影响，6月第一周日均零售量回落至4.21万

2025-06-21 15:28:23

685

联电考虑在台湾扩产，布局先进封装技术 6月20日，晶圆代工大厂联电回应市场传闻时表示，不排除未来在台湾地区扩充产能的可能性，并计划推动更全面的先进封装解决方案。对于市场传出联电有意收购南科瀚宇彩晶厂房的消息，联电财务长刘启东并未直接回应，仅表示公司会持续评估对运营和利润有帮助的机会，包括厂房选址、技术合作与新投资项目，台湾仍是扩产的重要考量地点。目前，联电已在新加坡建立了2.5D先进封装产能，并已将部分工艺转移至台湾。公司指出，未来将根据业务发展和整体战略，结合现有的晶圆对晶圆键合（WafertoWaferBonding）技术，在台

2025-06-21 15:22:01

469

Meta发布最新款智能眼镜 399美元起售 6月20日，科技公司Meta宣布与欧洲知名眼镜制造商依视路陆逊梯卡（EssilorLuxottica）合作，推出全新智能眼镜产品线OakleyMeta。该系列首款产品命名为“OakleyMetaHSTN”，专为运动员和运动爱好者打造，基础款起售价为399美元，预计将于今年夏季正式发售；限量版则定于7月11日开启预售，价格为499美元。与此前发布的MetaRay-Ban智能眼镜相似，这款新设备同样内置前置摄像头、开放式耳机扬声器及麦克风，所有组件均隐藏在镜架内部。用户将眼镜与手机连接后，可实现播放

2025-06-21 15:16:01

578

WriteSonic 怎么创作旅游宣传图？WriteSonic 旅游宣传图生图全解析 WriteSonic生成旅游宣传图需明确主题与受众、准备高质量描述、选择合适工具、审查迭代优化、添加品牌元素、调整尺寸格式。首先明确宣传信息和目标受众，接着撰写详细文字描述，选择ImageGeneration或Photosonic等工具生成图像，反复审查并修改至满意，随后添加标题、Logo等品牌元素，最后根据使用场景调整图像尺寸与格式，结合色彩心理学、构图技巧及目的地特色提升吸引力，并注意版权与创意补充以克服AI局限。

2025-06-21 15:03:01

787

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Node.js-前端工程化必学

25735次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

PHP中文网抖音号: 发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部