英伟达收购消息传出,或将进一步扩大其软件生态护城河

P粉986688829
发布: 2025-12-21 13:32:03
原创
637人浏览过
英伟达收购SchedMD以掌控Slurm开源调度系统,承诺维持其开源中立性并整合CUDA实现SM级GPU调度;升级企业支持体系,原生集成DGX Cloud,并扩展机密计算安全调度能力。

英伟达近期宣布收购ai软件公司schedmd,此举直接关联其slurm开源工作负载管理系统的控制权与演进路径。slurm作为全球超算中心广泛采用的调度系统,其深度适配英伟达最新硬件后,已成为生成式ai模型训练与推理的关键基础设施组件。以下是针对该收购事件所引发的生态影响与技术整合路径的解析:

本文运行环境:MacBook Pro M3 Max,macOS Sequoia

一、Slurm开源治理权的承接与延续

英伟达明确承诺维持Slurm的开源属性与厂商中立定位,确保其继续以自由分发形式供全球HPC及AI开发者使用。此举旨在巩固社区信任,避免因商业接管导致核心用户迁移或分支分裂。

1、英伟达已正式接管SchedMD全部Slurm代码仓库与CI/CD基础设施。

2、原Slurm维护团队核心成员整体转入英伟达HPC软件部门,保留技术决策席位。

3、未来所有Slurm主版本更新将同步发布于GitHub官方仓库,并标注“NVIDIA-supported”标识。

二、CUDA与Slurm的深度协同优化

通过将Slurm调度逻辑与CUDA运行时堆进行底层对齐,可实现GPU资源分配粒度从节点级细化至流处理器组(SM)级,显著提升多租户AI训练作业的隔离性与吞吐效率。

1、启用CUDA-aware Slurm插件,自动识别NCCL通信拓扑并绑定GPU实例。

2、在slurm.conf中配置GresType=gpu与GresFlags=cooperative参数,启用协作式GPU共享。

3、调用sbatch提交任务时,通过--gpus-per-task=2 --cpus-per-gpu=8精确声明异构资源配比。

三、企业级支持服务架构升级

英伟达将沿用SchedMD原有商业模式,即基础软件免费开源,营收来源于工程实施、定制化开发与SLA保障服务。新架构下,支持响应等级按客户类型分级,覆盖从学术实验室到超大规模云服务商。

1、设立三级支持通道:社区论坛(免费)、NVIDIA Enterprise Support(年费订阅)、NVIDIA AI Infrastructure Concierge(专属客户经理+现场驻场)。

Browse AI
Browse AI

AI驱动的网页内容抓取和数据采集工具

Browse AI 105
查看详情 Browse AI

2、所有付费支持合同默认包含Slurm与CUDA版本兼容性矩阵验证服务。

3、面向CoreWeave等云合作伙伴,提供白标Slurm管理控制台集成SDK。

四、Slurm调度器与DGX Cloud的原生集成

DGX Cloud作为英伟达托管式AI基础设施平台,需将Slurm抽象为云原生服务接口。此次收购使Slurm可直接嵌入DGX Cloud的Kubernetes Operator中,实现AI作业从YAML定义到GPU物理调度的端到端自动化。

1、在DGX Cloud控制台启用“Slurm Mode”,自动部署高可用Slurm Controller集群。

2、用户通过kubectl apply -f job.yaml提交PyTorch DDP训练任务,Operator自动转换为srun指令并注入NCCL环境变量

3、GPU利用率、显存占用、NVLink带宽等指标实时回传至DGX Cloud监控面板,与Prometheus无缝对接。

五、安全增强型调度策略扩展

针对多租户AI推理场景中日益突出的侧信道攻击风险,英伟达正基于Slurm底层框架开发硬件辅助隔离模块,利用NVIDIA Confidential Computing技术,在调度层强制实施GPU内存加密与执行上下文锁定。

1、启用slurm.conf中的ConfidentialCompute=yes参数,触发GPU可信执行环境(TEE)初始化。

2、所有srun启动的容器进程自动加载NVIDIA Driver 550+ Confidential Compute驱动模块。

3、调度器拒绝未签署Enclave签名的模型加载请求,错误码返回SLURM_ERROR_CONFIDENTIALITY_VIOLATION

以上就是英伟达收购消息传出,或将进一步扩大其软件生态护城河的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号