首页 > 新闻 > IT新闻 > 正文

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

聖光之護
发布: 2025-11-18 17:04:01
原创
862人浏览过

马斯克旗下的 ai 公司 xai 正式发布 grok 4.1,宣称该模型在对话智能、情感理解与实际应用能力方面实现了全新突破,重新定义了行业标杆。目前,grok 4.1 已登陆 grok.com 以及 iosandroid 应用平台,用户可通过模型选择器手动切换至 “grok 4.1” 模式使用。

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

据官方介绍,Grok 4.1 在创造力、情感交互能力与协作性能上均有显著增强,同时延续了此前版本所具备的高智商与稳定性。为达成这些进步,xAI 在 Grok 4 大规模强化学习的基础上,进一步优化了模型的“风格表达、人格化特征、辅助性功能及对齐机制”。此次升级特别引入了一种创新方法:采用“先进的代理式(agentic)推理模型”作为奖励模型,使其能够自主评估响应质量,并实现大规模迭代优化。

Grok 4.1 技术亮点与基准测试表现

  • 在 LMArena 的 “Text Leaderboard” 测试中,Grok 4.1 的“思考模式”(代号 quasarflux)取得了 1483 Elo 分的成绩,领先于所有非 xAI 开发的模型;其“非推理模式”(代号 tensor,即无思考 tokens 的即时回复模式)也达到 1465 Elo,超越其他模型在完整推理配置下的表现。
  • 在情感智能测评(EQ-Bench3)中,Grok 4.1 展现出更强的共情能力、心理洞察力和人际互动水平。
  • 创意写作评测(Creative Writing v3 benchmark)结果显示,新模型的语言更具角色个性,情感表达更丰富,叙事张力明显提升。
  • 在降低“幻觉”现象(即对事实问题给出错误回答)方面亦取得进展。特别是在“非推理模式”下结合搜索工具时,幻觉率显著下降。这一改进通过 FActScore(生物传记类问题基准)得到了验证。

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

知我AI·PC客户端
知我AI·PC客户端

离线运行 AI 大模型,构建你的私有个人知识库,对话式提取文件知识,保证个人文件数据安全

知我AI·PC客户端 35
查看详情 知我AI·PC客户端

xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

了解更多:https://www.php.cn/link/8f94f061698ba1df2c83661cd4ab9000

源码下载地址:点击获取

以上就是xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号