智谱ai正式推出glm-4.6v系列开源多模态大模型,涵盖旗舰级glm-4.6v(106b-a12b)与轻量免费版glm-4.6v-flash(9b)。该系列首创“图像即参数,结果即上下文”的原生多模态工具调用机制,支持高达128k的视觉上下文长度,可一次性解析约150页pdf文档或长达1小时的视频内容。

作为GLM家族在多模态方向的关键升级,GLM-4.6V将训练阶段支持的最大上下文扩展至128K tokens,在视觉理解准确率方面刷新同参数量级SOTA纪录,并首次在模型底层架构中深度集成 Function Call(函数/工具调用)能力,实现从「视觉输入感知」到「可执行操作指令」的端到端闭环,为构建真正可用的多模态智能体(Multimodal Agent)提供统一、高效的技术支撑。
在涵盖图文问答、视觉推理、跨模态检索等在内的30余项权威多模态基准测试中,GLM-4.6V全面领跑同规模竞品;其API调用成本相较前代下降50%。典型落地场景包括:AI图文协同创作、视觉驱动的智能导购助手、网页截图→前端代码一键生成、以及长时序视频内容结构化分析。全部模型权重与配套代码已同步上线GitHub、Hugging Face及魔搭(ModelScope)平台。


为降低开发者使用门槛,智谱同步开放完整技术栈:模型权重、推理脚本、示例工程及在线体验入口。
创想C2C商城系统,系统功能仿照淘宝设计,采用模块标签技术和静态html生成技术 基于Asp.Net/C#+SQL的开发的创想多用户商城系统,具有智能化、高扩展、稳定安全等特性,后台可自由添加频道,自由修改界面风格,商品无限级 分类,支持在线支付整合,通过安装和使用创想C2C商城系统,就可以轻松建立起专业大型的网上交易平台。创想C2C多用户商城系统5.6.3.8版本升级功能1.网站地区设置功能的增
0
GLM-4.6V全系列模型权重、推理代码与参考项目均已开源:
当前已适配主流推理框架,包括 SGLang、vLLM、transformers、xLLM 及昇腾NPU专用加速库,支持在NVIDIA GPU及多种国产AI芯片(如昇腾Ascend)环境下灵活部署GLM-4.6V与GLM-4.6V-Flash。
除本地化部署外,智谱还提供全托管式云推理服务与标准化API接口,助力企业快速集成:
技术深度解析博客:z.ai/blog/glm-4.6v
源码地址:点击下载
以上就是智谱开源多模态大模型 GLM-4.6V 系列的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号