必须严格匹配CUDA、cuDNN和深度学习框架版本;先用nvidia-smi查驱动支持的最高CUDA版本(如12.4),再根据GPU型号和框架官方推荐(如PyTorch 2.3配CUDA 12.1+cuDNN 8.9.2)选择组合,优先用conda install pytorch-cuda=12.1安装,最后验证torch.cuda.is_available()为True。

用GPU跑Python图像识别项目,核心是装对CUDA、cuDNN和深度学习框架的版本,三者必须严格匹配。跳过这步直接pip install,大概率报错“no CUDA-capable device”或“version mismatch”。
先打开终端执行:
nvidia-smi
看右上角显示的CUDA Version(这是驱动支持的最高CUDA版本),不是你装的CUDA版本。比如显示“CUDA Version: 12.4”,说明驱动兼容CUDA 12.4及以下——你可以装12.3,但不能装12.5。
同时记下GPU型号(如RTX 4090),去NVIDIA官方文档查它支持的CUDA最低版本(通常40系需CUDA 11.8+)。
别从官网下最新版!去PyTorch或TensorFlow官网查它们当前稳定版推荐的CUDA/cuDNN组合。例如PyTorch 2.3官方推荐CUDA 12.1 + cuDNN 8.9.2。
进Python后运行这几行:
立即学习“Python免费学习笔记(深入)”;
import torch
print(torch.cuda.is_available()) # 应输出True
print(torch.cuda.device_count()) # 看几块卡
print(torch.cuda.get_current_device()) # 当前设备ID
print(torch.cuda.get_device_name(0)) # 显卡名
如果is_available()返回False,常见原因:驱动太旧、CUDA路径没加进环境变量、或用了CPU-only版本的torch(比如装了torch而不是torch-cuda)。
以ResNet50微调为例,确保数据加载时启用GPU:
model = models.resnet50(pretrained=True).cuda() # .cuda()搬模型到GPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
# 数据也送GPU
images, labels = images.to(device), labels.to(device)
训练循环里加torch.cuda.empty_cache()可缓解显存碎片,尤其小显存卡(如RTX 3060 12G)跑大batch时有用。
基本上就这些。不复杂但容易忽略版本对齐,建议第一次搭环境时直接用conda + 官方推荐命令,比手动配稳妥得多。
以上就是Python图像识别项目GPU训练环境如何快速搭建【指导】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号