9月16日,nvidia在ai领域的强势地位不仅源于其gpu的强大性能,更得益于cuda软件生态的深厚积累,这一生态体系被视为其在ai战场上的核心壁垒。
面对竞争,AMD正加速构建自己的AI开发生态。继6月宣布推出全新ROCm 7之后,今日该平台已正式发布,标志着AMD向CUDA生态发起正面挑战。值得一提的是,ROCm 7为开源项目,现已在Github上线,供全球开发者使用。
此次更新带来了多项关键升级,包括对MI350X与MI355X显卡的支持, 实现了这两款GPU的KVM直通功能,并全面兼容PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3 和 JAX 0.6.0等主流AI框架。
更多技术细节可查阅ROCm官方文档:rocm.docs.amd.com。

在早前的发布会上,AMD展示了ROCm 7的实际性能表现,运行Llama 3.1 70B模型时性能提升达3.2倍,Qwen2-72B提升3.4倍,DeepSeek R1更是实现了3.8倍的显著提速。
在训练场景中,Llama 2 70B、Llama 3.1 8B以及Qwen 1.5 7B等模型的平均性能提升也达到了3倍之多。
此外,AMD透露,2024年内将持续优化ROCm 7生态,计划扩展至锐龙平台的笔记本和工作站,全面支持Linux系统,并将首次正式引入对Windows系统的支持,此前长期困扰开发者的兼容性问题正在逐一攻克。

以上就是CUDA来战 AMD ROCm 7软件平台正式发布:AI性能3.5倍提升的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号