阿里云重磅发布!开源ai推理模型qwq-32b-preview惊艳亮相,推理能力媲美openai!
11月28日,阿里云通义团队正式开源了其全新AI推理模型QwQ-32B-Preview,并在多个平台开放体验。测试结果显示,该模型在数学、编程等领域展现出令人瞩目的研究生级推理能力,整体水平与OpenAI的o1模型不相上下。

QwQ(Qwen with Questions),作为通义千问Qwen大模型的实验性分支,是阿里云首个开源的AI推理模型。阿里云团队的研究表明,充分的思考、质疑和反思能够显著提升模型对数学和编程的理解。QwQ正是基于这一理念取得了突破性进展。
在多项权威评测中,QwQ表现出色:GPQA评测集(科学问题解决能力)准确率达65.2%;AIME评测(综合数学)胜率50%;MATH-500评测(数学解题能力)得分高达90.6%,超越o1-preview和o1-mini;LiveCodeBench评测(高难度代码生成)答对率达50%。
QwQ的独特之处在于其深度自省能力。面对复杂问题,它能够质疑自身假设,进行深入的自我反思,并仔细检查每一步推理过程。例如,在“猜牌问题”中,QwQ通过分析对话和情境,展现了其缜密的思考能力,最终得出正确答案。
目前,QwQ-32B-Preview已在魔搭社区和HuggingFace平台开源,并迅速引发全球开发者的关注和热议。 虽然QwQ展现出强大的分析能力,但阿里云团队也指出,该模型仍处于实验阶段,存在一些局限性,例如语言混合使用、潜在偏见以及对专业领域知识的不足。团队表示,这些问题将在后续的研究和迭代中逐步解决。
访问链接:
以上就是阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号