首页 > 新闻 > IT新闻 > 正文

马斯克xAI发布Grok 4.1,正面硬刚谷歌与OpenAI并登顶排行榜

P粉602998670
发布: 2025-11-18 17:25:54
原创
788人浏览过

北京时间11月18日,就在谷歌即将发布其新一代gemini模型的前夕,马斯克旗下的人工智能公司xai,突然发布了其最新的大语言模型grok 4.1,正面硬刚谷歌与openai。官方宣称,这款前沿模型在对话智能、情感理解等方面树立了新的标杆。马斯克本人也转发并表示,用户将会注意到其在速度和质量上的显著提升。

马斯克xAI发布Grok 4.1,正面硬刚谷歌与OpenAI并登顶排行榜 - php中文网

登顶大模型竞技场排行榜

根据大模型竞技场(LMArena)最新公布的文本能力排行榜,Grok 4.1的两个版本已成功占据了榜首位置。其中,具备深度思考能力的Grok 4.1 Thinking版本以1483分的Elo分数高居第一,而非推理模式的Grok 4.1则以1465分紧随其后,位列第二。

官方表示,在为期两周的静默发布和盲测中,Grok 4.1在与前代模型的对比评估中,有64.78%的概率被用户偏好选择。

核心升级:情感智能与“人情味”

此次Grok 4.1更新的一个重要方向,是情感智能的提升,这与OpenAI上周发布的GPT-5.1迭代方向不谋而合。xAI官方表示,新模型能够更敏锐地感知用户的细微意图,沟通更顺畅,并保留了其敏锐的智能。在评估情绪智能的EQ-Bench测试中,Grok 4.1的两个版本同样包揽了榜单的前两名。

官方通过案例展示了Grok 4.1在处理情绪类问题时的进步。例如,当用户表达“想念我的猫,心都碎了”时,新模型的回复在细节和同理心上,都比前代模型更加丰富和真实。

在创意写作方面,新版本也表现出了更强的文学表达和戏剧张力。

知我AI·PC客户端
知我AI·PC客户端

离线运行 AI 大模型,构建你的私有个人知识库,对话式提取文件知识,保证个人文件数据安全

知我AI·PC客户端 35
查看详情 知我AI·PC客户端

马斯克xAI发布Grok 4.1,正面硬刚谷歌与OpenAI并登顶排行榜 - php中文网

另一大进步:大幅减少“幻觉”

除了情感智能,Grok 4.1在减少“幻觉”(即生成不符合事实的内容)方面也取得了显著进步。官方表示,在模型的后训练阶段,团队专注于减少信息检索提示中出现的事实性幻觉。数据显示,Grok 4.1的幻觉率已从前代的12.09%,大幅下降至4.22%,减少了近三倍。

为实现这些性能提升,xAI采用了创新的训练方法。他们开发了能够利用前沿的智能推理模型作为“奖励模型”的新方法,从而可以大规模地自主评估并迭代输出结果,优化模型的风格、个性与一致性。

大模型领域的竞争正愈演愈烈。在OpenAI刚刚更新其产品线、谷歌也即将发布其重磅新作之际,大模型竞技场榜首的位置是否会再次易主?一切都还是未知数。

以上就是马斯克xAI发布Grok 4.1,正面硬刚谷歌与OpenAI并登顶排行榜的详细内容,更多请关注php中文网其它相关文章!

谷歌浏览器
谷歌浏览器

谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁,使用起来得心应手。这里提供了谷歌浏览器纯净安装包,有需要的小伙伴快来保存下载体验吧!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号