解决 TorchScript 模型 CUDA 设备不一致问题：教程与实践

霞舞

发布时间：2025-07-31 19:02:11

1022人浏览过

来源于php中文网

原创

解决 torchscript 模型 cuda 设备不一致问题：教程与实践

本文档旨在帮助解决在使用 TorchScript 模型时遇到的 "RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu" 错误。通过分析问题原因，提供详细的解决方案，并给出实际代码示例，确保模型在 CUDA 环境下正确运行，从而提高推理效率。

问题分析

这个错误通常发生在模型的一部分在 CUDA 设备上运行，而另一部分在 CPU 上运行的时候。PyTorch 要求所有参与运算的 Tensor 必须在同一个设备上。可能的原因包括：

模型内部某些层或操作显式地指定了 CPU 设备。
输入数据没有完全移动到 CUDA 设备上。
TorchScript 在 tracing 过程中捕获了默认设备（CPU），导致模型在 CUDA 上运行时出现设备不一致。

解决方案

以下步骤可以帮助你解决这个问题：

1. 检查模型代码

首先，仔细检查你的模型代码，特别是模型定义和 forward 函数，查找任何显式指定 torch.device("cpu") 或类似操作的地方。如果发现，根据需要将其修改为使用 CUDA 设备。

2. 确保所有输入数据都在 CUDA 上

在将数据传递给模型之前，确保所有输入 Tensor 都已移动到 CUDA 设备。在 C++ 代码中，可以使用 .to(torch::kCUDA) 方法；在 Python 代码中，可以使用 .to(device) 方法，其中 device 是 CUDA 设备。

C++ 示例：

if (torch::cuda::is_available()) {
    n_model = torch::jit::load("/home/lzh/Storage4/lzh/deepmodel/model_scripted.pt",torch::kCUDA);
    std::cout << torch::cuda::device_count() << std::endl;
} else {

    std::cerr << "No CUDA devices available, cannot move model to GPU." << std::endl;
}
torch::Tensor inputs = torch::from_blob(fre, {1, 4,300, 201}, torch::kFloat).to(torch::kCUDA);
std::cout << inputs.device() << std::endl;
textInput.input_ids.to(torch::kCUDA);
textInput.attention_mask.to(torch::kCUDA);
torch::Tensor out_tensor = n_model.forward({inputs,textInput.input_ids,textInput.attention_mask}).toTensor();

Python 示例：

device=torch.device("cuda:0")
text = torch.ones((1,25))
text = text.long().to(device)
image = torch.ones((1,4,300,201)).to(device)
model = torch.jit.load('model_scripted.pt', map_location=torch.device('cuda'))
model.eval()
out = model(image,text,text)

3. 在保存模型之前将模型移动到 CUDA 设备

这是最关键的一步。在 Python 中使用 torch.jit.trace 保存模型之前，先将整个模型移动到 CUDA 设备。这可以确保 TorchScript 在 tracing 过程中捕获 CUDA 设备信息。

arXiv Xplorer

ArXiv 语义搜索引擎，帮您快速轻松的查找，保存和下载arXiv文章。

下载

Python 示例：

import torch

# 假设你的模型是 'model'
device = torch.device("cuda:0")
model.to(device) # 将模型移动到 CUDA 设备

# 创建一些示例输入，也移动到 CUDA 设备
image = torch.rand(1,4,300,201).to(device)
text1 =  torch.rand(1,25).long().to(device)
text2 = torch.rand(1, 25).long().to(device)

# 使用 CUDA 设备上的输入 tracing 模型
traced_script_module = torch.jit.trace(model, (image,text1,text2))

# 保存 traced 模型
traced_script_module.save('model_scripted.pt')

解释：

model.to(device)：这行代码将模型的参数和缓冲区移动到指定的 CUDA 设备。
输入数据也需要移动到 CUDA 设备，确保 tracing 过程在 CUDA 上进行。
torch.jit.trace(model, (image,text1,text2))：使用 CUDA 设备上的输入数据 tracing 模型。

4. 加载模型时指定 CUDA 设备 (C++)

在 C++ 中加载 TorchScript 模型时，确保指定 CUDA 设备。这可以通过在 torch::jit::load 函数中传递 torch::kCUDA 选项来实现。

C++ 示例：

torch::jit::Module n_model;
if (torch::cuda::is_available()) {
    n_model = torch::jit::load("/path/to/model_scripted.pt", torch::kCUDA);
} else {
    std::cerr << "No CUDA devices available, running on CPU." << std::endl;
    n_model = torch::jit::load("/path/to/model_scripted.pt");
}

总结

解决 "RuntimeError: Expected all tensors to be on the same device" 错误的关键在于确保模型和所有输入数据都在同一个设备上运行。在保存 TorchScript 模型之前将模型移动到 CUDA 设备，并在加载模型时指定 CUDA 设备，可以有效避免这个问题。

注意事项：

在调试过程中，可以使用 torch.cuda.current_device() 和 tensor.device 属性来检查当前设备和 Tensor 所在的设备。
如果你的模型包含多个子模块，请确保所有子模块的参数和缓冲区都已移动到 CUDA 设备。

通过遵循这些步骤，你应该能够成功解决 TorchScript 模型在 CUDA 环境中运行时的设备不一致问题，并充分利用 GPU 的加速能力。

Python大文件处理策略_内存优化说明【指导】

Python面向对象实战讲解_类与设计模式深入理解

用Python构建微服务架构实践_FastAPI与Django对比详解

Python类装饰器使用_元编程解析【教程】

Python对象比较与排序_魔术方法解析【教程】

相关标签:

python ai c++ Python pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：解决PyMoo多目标优化问题中reshape array错误下一篇：解决 TorchScript 模型在 CUDA 上运行时设备不一致的问题

作者最新文章

Flask 路由端点未注册导致 url_for 构建失败的解决方案

2025-12-30 13:46

JavaScript 中正确遍历 Map 并转换为对象数组的方法

2025-12-30 13:47

《仁王3》最新实机短片：忍术系统“遁术”！

2025-12-30 13:47

国产大作逃不过这一遭?Steam惊现《影之刃零正版》

2025-12-30 13:50

“玩家期待”比开发更难？前B社高管揭秘营销困局

2025-12-30 13:53

《DQ11》制作人回归！重新执掌《勇者斗恶龙》系列

2025-12-30 13:54

如何在调用 karate.toJavaFile 前动态修改 XML 文件内容

2025-12-30 13:56

IDEA 插件 Maven With Me 更新 2.6.x 版本，新增自动同步项目配置助力多 JDK 版本开发！

2025-12-30 13:56

如何优雅同步 Python 多线程并实现跨线程异常驱动的全局退出

2025-12-30 14:03

如何在 PHP 中将多维数组中成对的 FAQ 问答项合并为结构化数据

2025-12-30 14:08

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

718

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

627

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

744

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

700

2023.08.11