首页 > 新闻 > IT新闻 > 正文

昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地

碧海醫心
发布: 2025-11-03 19:20:01
原创
973人浏览过

=

百度智能云混合云携手昆仑芯与HAMi(由密瓜智能发起并主导的 CNCF 开源项目),正式发布基于昆仑芯 P800 的 XPU/vXPU 双模式算力调度解决方案。该方案已在某金融行业客户的昆仑芯集群中成功落地,为智能客服、营销辅助等十余种 AI 应用提供稳定且灵活的算力支持。客户可在同一集群内自由切换使用昆仑芯 P800 的整卡 XPU 资源与虚拟化 vXPU 资源,既满足多样化业务需求,又实现国产算力资源的高效利用。

昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地

1. XPU/vXPU 双模调度,全面释放昆仑芯 P800 集群算力潜能

百度智能云联合 HAMi,围绕昆仑芯 P800 构建“XPU 整卡 + vXPU 虚拟化”双轨资源调度架构:XPU 模式通过拓扑优化调度和健康度评估机制,保障多卡训练任务的性能稳定性,避免资源碎片;vXPU 模式则支持显卡多规格切分,实现单卡承载多个轻量级任务,显著提升推理与开发场景下的资源利用率。两种模式协同运行,确保每一份算力都被充分调用,为各类 AI 业务提供强有力支撑。

XPU 整卡模式:拓扑寻优 + 健康评估,打造高性能训练底座

在对通信延迟敏感的大规模训练场景中,调度策略直接影响整体性能与集群可用性。针对昆仑芯 P800 的硬件特性,本方案从两个层面保障整卡调度的高效与稳定。

首先,系统可自动识别服务器内部“左右侧翼”的物理结构,优先在同一侧翼内完成资源分配,减少跨区通信损耗,同时防止资源零散占用导致后续调度困难。

其次,在多个节点均可满足需求时,系统将综合评估调度前后对节点拓扑完整性的影响,优先选择有助于维持或提升拓扑规整度的节点进行分配,保留更多完整的拓扑单元,降低未来出现调度失败或性能波动的风险。

依托“节点级拓扑优化 + 集群级健康评估”双重机制,运维人员无需频繁手动干预“拼卡”,大模型训练得以获得持续稳定的通信效率,集群资源排布也更加紧凑有序。

vXPU 虚拟化模式:细粒度切分 + 显存自动匹配,榨干每一寸算力

面向推理、测试验证及开发调试等低负载场景,vXPU 虚拟化模式提供了精细化算力分割与便捷管理能力。

X Studio
X Studio

网易云音乐·X Studio

X Studio 91
查看详情 X Studio

该模式允许多任务共享同一张昆仑芯 P800 显卡,支持 1/4 卡(24GB 显存)和 1/2 卡(48GB 显存)两种切分规格。用户只需声明所需显存大小,系统便会自动匹配最合适的虚拟化规格——例如申请 20GB 显存时,系统自动分配 24GB 的 1/4 卡实例,免去手动换算烦恼,极大简化操作流程。

此外,为增强隔离性与管理便利性,方案采用“同规格共享”原则:同一物理卡上仅允许相同切分规格的虚拟实例共存,有效规避资源争抢问题,降低运维复杂度。

UUID 精准控卡:自动化为主,人工兜底,关键场景不掉链子

借助整卡调度的拓扑优化能力和虚拟化的显存自动对齐功能,日常算力调度已基本实现无人工干预。但对于灰度测试、故障复现等特殊场景,系统仍保留“人工介入通道”——运维人员可通过指定物理卡 UUID,精准锁定或排除特定设备。例如,在新模型灰度发布时,仅需启用部分卡片即可完成验证;当需要排查硬件问题时,也能快速定位目标卡进行调试,而无需整机下线。

通过自动化调度与人工精细控制相结合,无论是大规模训练还是轻量级推理任务,系统都能兼顾调度效率与灵活性,从容应对复杂多变的AI业务需求。

2. 总结

此次 XPU/vXPU 双模式调度方案在金融领域的成功应用,标志着百度智能云混合云联合 HAMi 在国产 AI 算力调度技术上的重要突破——不仅验证了“以场景驱动调度设计”的创新路径,也体现了开源社区力量与企业级服务能力深度融合的巨大潜力。

如需获取昆仑芯 P800 虚拟化完整技术细节,请查阅官方文档:https://www.php.cn/link/17de7eb570312f4c297dc23606a0fedf

- - - - - - - - - - END - - - - - - - - - -

以上就是昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号