要点:
Qualcomm® AI200与AI250解决方案凭借行业领先的总体拥有成本(TCO),为数据中心的生成式AI推理提供机架级性能和卓越内存容量。Qualcomm AI250采用创新的近存计算架构,显著提升有效内存带宽与能效,实现AI工作负载处理能力的飞跃。两款产品均配备全面优化的软件栈,并兼容主流AI框架,助力企业及开发者在跨数据中心环境中安全、高效地部署可扩展的生成式AI应用。这些解决方案是高通技术公司多代数据中心AI推理路线图的重要组成,延续每年迭代的技术发展节奏。
2025年10月28日,圣迭戈——高通技术公司今日发布面向数据中心的新一代AI推理加速产品:基于Qualcomm AI200与AI250芯片的加速卡及整机架系统。依托公司在NPU领域的深厚积累,该系列产品实现了机架级高性能与大容量内存的结合,以更高的每瓦每美元性能支持高速生成式AI推理,标志着各行业迈向高效、灵活且可扩展AI部署的关键一步。
Qualcomm AI200专为大规模AI推理场景设计,适用于大语言模型(LLM)、多模态模型(LMM)及其他复杂AI任务,在保证优异性能的同时大幅降低总体拥有成本。单张加速卡配备高达768GB LPDDR内存,兼顾高容量与低成本优势,为AI推理带来更强的扩展性与部署灵活性。
Qualcomm AI250则首次引入近存计算(Near-Memory Computing)架构,使有效内存带宽提升超过10倍,同时显著降低功耗,全面增强AI推理的能效比与处理性能。该架构支持解耦式推理模式,实现硬件资源的动态调配与高效利用,精准匹配不同客户对性能与成本的多样化需求。
两款机架级系统均支持直接液冷技术,提升散热效率;支持PCIe纵向扩展和以太网横向扩展能力,并集成机密计算功能,保障AI工作负载的数据安全。整机架设计功耗为160千瓦,满足高性能运算下的能效与稳定性要求。


高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)表示:“通过Qualcomm AI200与AI250,我们正在重新定义机架级AI推理的边界。这些先进的基础设施方案让客户能够以极具竞争力的TCO部署生成式AI,同时满足现代数据中心对安全性、灵活性和可扩展性的严苛要求。凭借完整的软件生态与开放支持,我们使开发者和企业可以更便捷地集成、管理和扩展已训练模型。得益于与主流AI框架的无缝对接以及一键部署能力,AI200与AI250将加速应用落地与技术创新。”
高通提供的超大规模AI软件栈覆盖从应用层到系统底层的全链路,专为AI推理深度优化。该栈支持主流机器学习(ML)框架、推理引擎、生成式AI平台以及针对LLM/LMM的解耦服务等先进优化技术。开发者可通过高通高效的Transformer库(Efficient Transformers Library)和Qualcomm® AI Inference Suite,轻松实现模型接入,并支持Hugging Face模型的一键部署。软件体系还提供即用型AI应用、智能体、开发工具、函数库、API接口以及AI运维服务,全面提升开发与运营效率。
Qualcomm AI200预计于2026年投入商用,AI250将于2027年紧随其后。未来,高通技术公司将持续按照年度更新节奏推进数据中心AI产品路线图,聚焦打造行业领先的AI推理性能、能效表现与总体成本优势。更多详情,请访问官方网站。
以上就是高通技术公司发布AI200和AI250 重新定义AI时代机架级数据中心推理性能的详细内容,更多请关注php中文网其它相关文章!
 
                 
                                
                                 收藏
收藏
                                                                             
                                
                                 收藏
收藏
                                                                             
                                
                                 收藏
收藏
                                                                            Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号