PyTorch Tensor维度操作详解：创建、聚合与变换

花韻仙語

发布时间：2025-08-24 15:40:00

887人浏览过

来源于php中文网

原创

PyTorch Tensor维度操作详解：创建、聚合与变换

本文深入探讨PyTorch Tensor的维度管理机制。我们将详细解析Tensor创建时size参数的解读方式，理解其从末尾到开头的维度定义规则。接着，阐述聚合操作（如torch.sum）中axis参数如何影响计算方向与输出维度。最后，通过torch.softmax等变换操作，展示dim参数如何指定函数作用的维度范围，帮助读者全面掌握PyTorch Tensor的维度处理。

pytorch中的tensor是处理数据的基础结构，其维度的正确理解和操作是高效开发的关键。本文将从tensor的创建、聚合到变换三个核心方面，详细解析pytorch如何处理维度。

1. Tensor的创建与size参数

在PyTorch中创建Tensor时，size参数是定义其形状的关键。这个参数通常接受一个整数元组，每个整数代表对应维度的大小。理解size参数的解读方式至关重要：PyTorch将size元组中的维度从最后一个元素到第一个元素进行解释。具体来说，元组的最后一个元素代表Tensor的列数，倒数第二个元素代表行数，以此类推。

示例代码:

import torch

# 常见的Tensor创建方式
# 可以省略括号，直接作为位置参数传入：
t1 = torch.ones(2, 3) # 创建一个2行3列的矩阵
print(f"torch.ones(2, 3) shape: {t1.shape}") # 输出: torch.Size([2, 3])

# 当size参数需要作为元组传递时（例如，某些函数只接受一个size元组参数）：
t2 = torch.randint(10, (2, 3)) # 创建一个2行3列的随机整数矩阵
print(f"torch.randint(10, (2, 3)) shape: {t2.shape}") # 输出: torch.Size([2, 3])

维度解读规则:

size=(..., m, n)
n 代表最内层（通常是列）的数量。
m 代表次内层（通常是行）的数量。
... 依此类推，表示更高维度的数量。

不同size参数的Tensor形状示例:

size 参数	描述	列数 (最内层)	行数 (次内层)	更高维度	实际形状 (.shape)
(2,)	长度为2的一维Tensor	2	-	-	(2,)
(2,1)	2行1列的矩阵	1	2	-	(2,1)
(1,2)	1行2列的矩阵	2	1	-	(1,2)
(3,2)	3行2列的矩阵	2	3	-	(3,2)
(4,3,2)	4个3行2列的矩阵	2	3	4	(4,3,2)

注意事项:

size=(2,) 创建的是一个一维Tensor，它只有一个维度。
size=(2,1) 和 size=(1,2) 都是二维Tensor（矩阵），尽管它们在视觉上可能看起来像向量，但其内部结构和操作行为与一维Tensor不同。理解这一点对于避免维度错误至关重要。

2. Tensor的聚合与axis参数

许多PyTorch Tensor的方法，如torch.sum()、torch.mean()等，都需要一个axis（或dim）参数来指定操作沿着哪个维度进行。当指定axis时，操作将沿该维度进行，并通常会减少Tensor的维度。

torch.sum() 的行为解析:

慧中标AI标书

慧中标AI标书是一款AI智能辅助写标书工具。

下载

以torch.sum(axis=axis)为例，其行为可以总结为两点：

沿指定维度求和： 操作会沿着axis参数所指定的维度对所有元素进行求和。
维度缩减与重排： 被求和的维度将从Tensor的形状中移除，导致Tensor的维度减少。其余维度会相应地“移动”以填充被移除维度留下的空位。

axis=-1 的特殊意义:axis=-1 总是指代Tensor的最后一个维度（即最内层的维度，在二维矩阵中通常是列维度）。

对于一维Tensor (N,)，sum(axis=-1) 将所有N个元素相加，结果是一个标量。
对于二维Tensor (M, N)，sum(axis=-1) 将对每一行中的所有N个列元素求和，生成一个长度为 M 的一维Tensor。
对于更高维度的Tensor，sum(axis=-1) 会在最内层进行求和，并消除该维度。

示例：torch.sum() 操作

假设我们有一个由1组成的Tensor t = torch.ones(size)：

size 参数	axis	输出形状 (.shape)	输出值	解释
(2,)	-1或0	[]	tensor(2.)	沿唯一维度求和，结果为标量。
(2,1)	-1或1	[2]	tensor([1., 1.])	沿列（axis=1）求和，每行只有一个元素，结果保留行维度。
(1,2)	-1或1	[1]	tensor([2.])	沿列（axis=1）求和，每行有2个元素，结果为单元素向量。
(3,2)	-1或1	[3]	tensor([2., 2., 2.])	沿列（axis=1）求和，每行2个元素，结果为3个元素的向量。
(4,3,2)	-1或2	[4,3]	tensor([[2., 2., 2.],[2., 2., 2.],[2., 2., 2.],[2., 2., 2.]])	沿最内层（axis=2）求和，每个子矩阵的2个元素相加，维度从(4,3,2)变为(4,3)。

关键点:

axis 参数可以是正数（从0开始索引）或负数（从-1开始索引，-1代表最后一个维度，-2代表倒数第二个维度，以此类推）。
聚合操作通常会减少Tensor的维度。如果需要保留维度（例如，为了后续的广播操作），可以使用keepdim=True参数。

3. Tensor的变换与dim参数

Tensor变换操作，如torch.softmax()、torch.log_softmax()等，通常会改变Tensor的值，但保留其原始形状。在这些操作中，dim参数用于指定变换应该沿哪个维度进行

如何高效地将S3中的PNG/JPEG图像流式编码为Base64（无需完整下载）

Python 多线程在 I/O 密集场景下为什么有效？

如何高效地在Python中检查多个姓名是否同时存在于字典的字符串字段中

PySpark 中实现累计递归滞后计算（如复利式更新列 A）

PySpark 中实现累积滞后递归计算（如复利式列更新）

相关专题

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

432

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

Java编译相关教程合集

本专题整合了Java编译相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.21

C++多线程相关合集

本专题整合了C++多线程相关教程，阅读专题下面的的文章了解更多详细内容。

2026.01.21

无人机驾驶证报考 uom民用无人机综合管理平台官网

无人机驾驶证（CAAC执照）报考需年满16周岁，初中以上学历，身体健康（矫正视力1.0以上，无严重疾病），且无犯罪记录。个人需通过民航局授权的训练机构报名，经理论（法规、原理）、模拟飞行、实操（GPS/姿态模式）及地面站训练后考试合格，通常15-25天拿证。

2026.01.21

Python多线程合集

本专题整合了Python多线程相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.21

java多线程相关教程合集

本专题整合了java多线程相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.21

windows激活码分享 windows一键激活教程指南

Windows 10/11一键激活可以通过PowerShell脚本或KMS工具实现永久或长期激活。最推荐的简便方法是打开PowerShell（管理员），运行 irm https://get.activated.win | iex 脚本，按提示选择数字激活（选项1）。其他方法包括使用HEU KMS Activator工具进行智能激活。

2026.01.21