首页 > 新闻 > IT新闻 > 正文

阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1

星夢妙者
发布: 2025-01-09 09:15:51
原创
1136人浏览过

阿里云重磅发布!开源ai推理模型qwq-32b-preview惊艳亮相,推理能力媲美openai!

11月28日,阿里云通义团队正式开源了其全新AI推理模型QwQ-32B-Preview,并在多个平台开放体验。测试结果显示,该模型在数学、编程等领域展现出令人瞩目的研究生级推理能力,整体水平与OpenAI的o1模型不相上下。

阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1

QwQ(Qwen with Questions),作为通义千问Qwen大模型的实验性分支,是阿里云首个开源的AI推理模型。阿里云团队的研究表明,充分的思考、质疑和反思能够显著提升模型对数学和编程的理解。QwQ正是基于这一理念取得了突破性进展。

在多项权威评测中,QwQ表现出色:GPQA评测集(科学问题解决能力)准确率达65.2%;AIME评测(综合数学)胜率50%;MATH-500评测(数学解题能力)得分高达90.6%,超越o1-preview和o1-mini;LiveCodeBench评测(高难度代码生成)答对率达50%。

QwQ的独特之处在于其深度自省能力。面对复杂问题,它能够质疑自身假设,进行深入的自我反思,并仔细检查每一步推理过程。例如,在“猜牌问题”中,QwQ通过分析对话和情境,展现了其缜密的思考能力,最终得出正确答案。

目前,QwQ-32B-Preview已在魔搭社区和HuggingFace平台开源,并迅速引发全球开发者的关注和热议。 虽然QwQ展现出强大的分析能力,但阿里云团队也指出,该模型仍处于实验阶段,存在一些局限性,例如语言混合使用、潜在偏见以及对专业领域知识的不足。团队表示,这些问题将在后续的研究和迭代中逐步解决。

访问链接:

以上就是阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1的详细内容,更多请关注php中文网其它相关文章!

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
热门推荐
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号