9月7日,据最新消息,nvidia的rtx 5090与rtx pro 6000显卡被曝出存在一个可稳定复现的虚拟化重置漏洞,导致显卡在触发后完全失去响应,唯有通过物理重启主机才能恢复运行。
这一问题由GPU云服务提供商CloudRift在生产环境中首次大规模发现。该公司在多个搭载NVIDIA Blackwell架构芯片的系统上遭遇异常后,发布了一份详尽的技术分析报告,并宣布设立1000美元悬赏,公开征集能够定位问题根源或提出有效解决方案的开发者或研究人员。

根据CloudRift提供的日志记录,该漏洞出现在GPU通过KVM结合VFIO技术直通至虚拟机的场景中。当虚拟机关闭或GPU资源重新分配时,主机系统会向显卡发送PCIe功能级重置(FLR)指令。
然而,与正常行为不同的是,RTX 5090和RTX PRO 6000并未在FLR后恢复正常,反而进入无响应状态。内核日志显示:“FLR后65535毫秒仍未就绪;放弃。”
此时,显卡对系统而言已“消失”——lspci命令无法读取其信息,并报出“未知头部类型7f”的错误代码。CloudRift强调,目前唯一有效的恢复方式是彻底切断电源并重新启动整台设备。
AI初创企业Tiny Corp也成功复现了该问题,并公开质疑:“RTX 5090和RTX PRO 6000是否存在硬件层面的设计缺陷?我们已深入排查,但仍未找到可行的修复路径。”
社区讨论迅速升温,不少个人用户及RTX 5090的早期使用者纷纷反馈类似经历。有用户描述,在关闭一个运行Windows的虚拟机后,主机系统立即卡死,即便执行操作系统级重启,GPU仍无法被重新识别和初始化。
进一步测试表明,调整PCIe的ASPM(Active State Power Management)或ACS(Access Control Services)设置均无法避免故障发生。截至目前,并未发现上一代显卡(如RTX 4090)出现相同问题,暗示此漏洞可能专属于NVIDIA Blackwell架构产品线。

以上就是RTX 5090遇诡异Bug完全无响应!悬赏1000美元寻解决方案的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号