智谱官方发布消息,其最新开源大语言模型 glm-4.7 在全球权威大模型评测榜单 artificial analysis intelligence index(aa 智能指数)中,以总分 68 分的成绩强势登顶——同时位列开源模型与国产模型双榜首,并在全球所有参评模型中排名第六。

该榜单由 Artificial Analysis 发布,聚焦模型在知识覆盖、逻辑推演、代码生成及 Agent(智能体)能力等关键维度的表现,被广泛视为衡量大模型综合水平最具公信力的行业标尺。
GLM-4.7 是智谱于近日正式发布的全新开源版本,在面向编程任务场景下,重点增强了代码理解与生成能力、长周期任务拆解规划能力,以及多工具协同调用能力,在编程、推理与智能体三大方向实现跨越式升级。
- 编程能力再突破:全面优化多语言编码表现,尤其在终端智能体环境中的稳定性与准确性显著提升;GLM-4.7 已支持在 Claude Code、TRAE、Kilo Code、Cline 和 Roo Code 等主流编程框架中落地“思考—决策—执行”闭环机制,复杂工程任务处理更可靠。
- 前端生成更出彩:网页、PPT、宣传海报等可视化内容生成质量明显跃升,布局合理、风格协调、视觉体验更趋专业。
- 工具调用更精准:在 BrowseComp 网页交互任务评测中斩获 67.5 分;在 τ²-Bench 多步工具调用基准测试中以 87.4 分刷新开源模型纪录(SOTA),超越 Claude Sonnet 4.5。
- 推理性能更强劲:数学建模与逻辑推理能力大幅增强,在高难度 HLE(“人类终极考试”)基准中达 42.8% 正确率,相较 GLM-4.6 提升 41%,并已超越 GPT-5.1。
- 通用交互更自然:对话响应更凝练智能,兼具温度与个性;文本创作与角色扮演更具文学质感与沉浸张力。
源码地址:点击下载










