微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 新闻 > IT新闻 > 正文

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

霞舞

发布： 2025-09-30 20:20:01

原创

1212人浏览过

2025 年 9 月 24 日，rwkv7-g1a 2.9b 推理模型正式开源，进一步推动纯 rnn 架构在语言理解与生成方面的能力边界。

该模型基于 RWKV7-G1 2.9B 持续训练了 1T tokens 的高质量数据，在多个维度上实现显著性能跃升。

模型客观评测表现

英文及多语言能力

在同参数规模的开源模型中，RWKV7-G1a 2.9B 在基础英语和跨语言任务上的表现更为出色：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

作为一个未经针对性“刷榜”优化的纯预训练基座模型，其 MMLU 分数提升至 61.1%，MMLU Pro 达到 31.5%（此前版本分别为 58.0% 和 25.8%）。

真实能力评估：无法作弊的测试

Uncheatable Eval 是一种“防作弊”的评测方式，采用最新论文、新闻、代码、小说等实时内容，通过衡量模型对新信息的压缩能力（即“压缩即智能”理论），来检验语言模型的真实泛化水平。

在此项测试中，RWKV7-G1a 2.9B 表现持续进步，超越当前所有其他 3B 级别的开源模型。

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

实际应用演示

多语言翻译能力

建议使用保守解码设置进行翻译任务：temp=0.2，topp=0.2，presence=0，frequency=0，decay=0.996

支持多种语言同步互译：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

编程能力展示

推荐代码生成使用以下参数：temp=0.3，topp=0.3，presence=0，frequency=0，decay=0.996

解决最长公共子序列问题：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

实现 LRU 缓存结构设计：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

数学推理能力

解答数学题建议配置：temp=0.3，topp=0.3，presence=0，frequency=0，decay=0.996

抛物线相关计算：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

多项式方程处理：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

百川大模型

百川大模型

百川智能公司推出的一系列大型语言模型产品

百川大模型

62

百川大模型

物理问题求解

物理类问题推荐相同保守参数：temp=0.3，topp=0.3，presence=0，frequency=0，decay=0.996

计算火星表面重力加速度：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

创意文本生成

创作类任务可启用更开放的采样策略：temp=0.6，topp=0.7，presence=2，frequency=0.2，decay=0.99（注意为 0.99）

古体诗创作示例：

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

模型获取方式

可从以下平台下载 RWKV7-G1a 2.9B 模型权重：

Hugging Face：https://www.php.cn/link/f35841e00244e469c8bfa8a45272a6bc
魔搭社区：https://www.php.cn/link/1f1eb1eaff40d5b16011f0d5c49fbf13
WiseModel：https://www.php.cn/link/9d53b7a44f7aea7ef05b4bc3c1e37d09

如何运行 RWKV 模型

我们提供多种在线体验入口以及本地部署方案，帮助用户快速上手。

在线体验（对话模式）

为了让社区便捷体验 G1a 版本，我们推出了聊天界面的在线 demo：

Hugging Face Space：https://www.php.cn/link/274a743f5ed8555e1183b6b752cbeba7 G1a）
魔搭 Studio：https://www.php.cn/link/397dcbbb8a93272b66300d4126b4f9e9 G1a）

该对话系统由社区成员 @Leon 开发，并在 GitHub 项目 web-rwkv-realweb 中完全开源。

在线体验（文本续写模式）

也可通过官方 Gradio Demo 尝鲜 RWKV7-G1a 2.9B：

Hugging Face Gradio Demo：https://www.php.cn/link/7c8b2cb44792a9a6b30a02869a605fd8

此外，RWKV7-G1a 2.9B 支持新型推理范式（含长度控制功能），详情参见：RWKV7-G1a 1.5B 开源发布，新推理风格和长度控制，效果显著增强

本地运行指南

支持使用 RWKV Runner、Ai00、pip 包等方式本地加载模型。

同时，RWKV 已兼容主流推理框架如 llama.cpp 和 ollama。

鉴于 RWKV7-G1a 2.9B 为最新发布版本，目前推荐优先使用 RWKV Runner 以确保输出稳定性。

详细教程请访问 RWKV 官网 - 模型推理文档页面。

加入 RWKV 用户社区

欢迎加入 RWKV 开发生态！您可以通过以下渠道了解模型动态、参与讨论或获取技术支持：

? 中文官网文档：https://www.php.cn/link/ad627bf5fd6966693e97a7349d85589c
? RWKV 社区论坛：https://www.php.cn/link/ca66c4195dbebc6f59ceaf0e10629664
? QQ 频道链接：https://www.php.cn/link/6fb41c898918ad5a0df0e50f3790f057
? B站教学视频：https://www.php.cn/link/33bd495470ddcf80911ca403ad6e3dd6

我们鼓励基于 RWKV-7 的科研探索与创业实践，并将为相关项目提供必要的技术协助。
若您的团队正基于 RWKV 展开研究或产品开发，请联系我们！（可通过“RWKV元始智能”微信公众号留言联系方式，或发送邮件至 contact@rwkvos.com）

源码仓库：https://www.php.cn/link/1f1eb1eaff40d5b16011f0d5c49fbf130

以上就是RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git 微信公众号 github 微信 b站 qq ai ios 多语言 red 2025 本地部署架构 pip github rnn https llama

大家都在看：

微软确认 Windows 11 即将迎来重大变革，但引发强烈反对消息称苹果从微信小程序消费中抽取 15% 分成，腾讯回应晶片荒讯号、半导体扩张快专家忧：没有足够人力开出产能中央网信办严打一批涉学术论文买卖违法违规账号微软打造首个 AI 超级工厂：多座新一代 Fairwater 数据中心构成站点网络

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：苹果面向开发者推出 Foundation Models 框架下一篇：智源开源 RoboBrain-X0，打破机器人跨本体泛化困境

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

最新问题

纳德拉：微软不追逐低利润 AI 计算市场，重视长期发展在近期与德瓦基什・帕特尔的交流中，微软CEO萨提亚·纳德拉详细阐述了公司在人工智能和云计算领域的战略方向，并明确指出其与甲骨文等竞争对手之间的根本差异。纳德拉强调，微软并不打算通过向少数大型AI企业低价提供云服务来换取短期市场份额。相反，公司更关注打造一个开放、可持续且面向广泛客户的生态系统。他认为，仅靠牺牲利润换取计算规模的做法难以支撑长期创新。他提到，甲骨文计划通过低利润率的托管协议，在2028年前实现对微软计算能力的超越。对此，纳德拉认为这种策略缺乏远见。他预测，随着AI生态逐步成熟，Op

2025-11-14 21:10:02

714

马斯克否认 xAI 完成 150 亿美元融资传闻埃隆·马斯克否认了有关其人工智能公司xAI已完成150亿美元融资的媒体报道。此前，CNBC援引所谓“熟悉内情”的消息人士称，xAI正在进行一轮巨额融资，用于采购训练大模型Grok所需的GPU算力，同时声称本轮融资将使xAI估值达到2000亿美元。在人工智能行业融资频频刷新的背景下，该传闻迅速引发热议。近期，OpenAI于10月完成66亿美元融资，估值升至5000亿美元；路透社上月亦报道称，OpenAI正筹备以1万亿美元估值推进首次公开募股（IPO）。然而面对CNBC的

2025-11-14 21:02:02

874

DeepMind 发布 SIMA 2 预览版 GoogleDeepMind发布了新一代多模态智能体SIMA2，基于Gemini2.5Flash-lite模型构建，其任务完成成功率相较前代SIMA1提升近一倍。该智能体具备在未曾接触的新环境中执行复杂指令的能力，并拥有自我优化机制。目前版本以研究预览形式推出，核心目标是验证实现通用机器人与AGI所需的关键能力——高层级的世界理解与推理。SIMA2延续了使用数百小时游戏视频进行预训练的策略，但首次引入自生成数据闭环系统：当进入新场景时，系统会调用独立的Gemini模型批量生成潜在任务，再通过内部

2025-11-14 20:18:01

566

小米发布并开源“Xiaomi Miloco”：智能家居未来探索方案小米官方最新发布了一项面向智能家居的前沿探索方案——XiaomiMiloco（全称XiaomiLocalCopilot），旨在通过大模型技术全面重塑全屋智能的交互方式。该方案以米家系列摄像机作为视觉输入终端，依托小米自研的大规模语言模型，实现对全屋IoT设备的深度整合。基于先进的大模型开发架构，用户可通过自然语言自由设定家庭场景规则与个性化需求，解锁更丰富、更具想象力的智能设备联动模式。据官方介绍，用户只需使用日常口语表达指令，例如“开始读书时打开台灯并播放轻音乐”，系统即可理解意图并执行操作

2025-11-14 18:52:02

250

美国法官拒绝苹果与 OpenAI 希望驳回马斯克所提起诉讼的请求美国得克萨斯州沃斯堡的一名联邦法官马克・皮特曼（MarkPittman）于11月14日作出裁定，驳回了苹果公司与OpenAI请求撤销马斯克提起诉讼的动议。该诉讼聚焦于智能手机及生成式人工智能聊天机器人领域的垄断争议。马斯克旗下的社交平台X公司及其创立的人工智能初创企业xAI指控两家被告企业联手采取不公平手段压制市场竞争。皮特曼在判决书中明确表示，此项裁决并不意味着法院已认可X公司所提指控的真实性，案件仍需进入下一阶段以进一步审查相关事实。早在去年，X公司就已发起诉讼，声称苹果通过将C

2025-11-14 18:21:18

583

大麦娱乐推出全新品牌“大麦国际”：提供全球演出购票，接入支付宝网络 11月14日消息，大麦娱乐今日正式发布全新业务品牌——“大麦国际（MAISEAT）”，作为面向全球用户的演出服务平台，致力于为海内外观众提供涵盖演唱会、体育赛事、音乐节、戏剧等多元热门演出的票务购买与观演支持服务。据悉，大麦国际官方网站目前已正式上线，支持简体中文、繁体中文、英文、日文、韩文等多种语言浏览，并已接入支付宝全球支付网络，用户可灵活选择多种支付方式与币种完成交易。未来，大麦国际还将陆续推出支付宝国际小程序及独立应用程序（App），进一步提升用户体验。不同于主要服务于国内用户及大中华区

2025-11-14 18:19:12

671

蓝色起源首次成功回收火箭，SpaceX 马斯克祝贺贝索斯 11月14日消息，杰夫・贝索斯旗下的蓝色起源公司于美国东部时间11月13日15时55分（北京时间14日4时55分）成功发射了可重复使用的“新格伦”重型运载火箭，此次任务搭载了美国国家航空航天局的火星探测器，并首次实现了火箭回收。在这一里程碑事件后，贝索斯在航天领域的劲敌——SpaceX创始人埃隆・马斯克当天向其发去祝贺：向贝索斯和蓝色起源团队表示祝贺。本次发射顺利完成了火箭第一级助推器的回收任务。根据直播画面显示，在火箭一、二级分离后，第二级连同所搭载的“ESCAPAD

2025-11-14 18:15:02

435

英伟达拖累华尔街跌至近一个月来最糟水平，AI“明星股”持续走弱 11月14日讯，当地时间11月13日，据美联社报道，美国股市正滑向自春季大规模抛售以来最惨淡的一天，英伟达及其他人工智能（AI）热门股的持续下挫，引发市场对AI概念股估值是否已严重脱离基本面的担忧。与此同时，投资者开始质疑美联储是否会按预期降息，进一步加剧了市场的不安情绪。当日，标准普尔500指数下挫1.5%，逐步远离上个月创下的历史高点。若最终收盘维持该跌幅，这将是近一个月内表现最差的交易日，同时也是自今年4月美国推出新关税政策导致股市重挫以来的第二大单日跌幅。道琼斯工业平均指数下跌565点，

2025-11-14 18:11:01

652

古尔曼：特斯拉车机即将支持苹果 CarPlay，内测已经开始感谢网友对的时间点、补药吖、風見暉一的线索投递！11月14日消息，据彭博社记者马克・古尔曼援引知情人士消息，特斯拉正在为旗下车型加入苹果的CarPlay支持，并已在内部展开测试。CarPlay在不少车企中已广泛使用，能在车载娱乐系统中呈现优化后的iPhone界面，被许多驾驶者视为必备功能。若特斯拉最终加入CarPlay，将代表马斯克的立场出现明显转变。马斯克多年拒绝引入这项热门功能，并持续批评苹果的AppStore政策，同时也对苹果为研发自家电动汽车而挖走特斯拉工程师一事极为不

2025-11-14 18:07:02

915

三星押注Galaxy Z Flip 8轻薄设计！目标出货量增加10% 延续ZFold7热潮今年，三星对GalaxyZFold7进行了全面革新，成功将其打造成目前市面上最轻薄的摺叠手机之一。这项策略成效显著，ZFold7的销售表现超越了过往所有世代的Fold系列机型。反观ZFlip7，由于外观与结构未有明显改变，市场反应相对平淡，销量未能同步攀升也在预料之中。延伸阅读：解救国人睡眠困境！三星电子睡眠呼吸中止检测获准、主动揪病兆三星SmartThings宣布重大更新：Siri捷径相容、实现跨生态系统智慧家庭声控【懒人包】三星2025Un

2025-11-14 17:30:07

405

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

13727次学习
收藏
Git工具使用小知识

172775次学习
收藏
Git版本控制工具

14401次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部