PyTorch 中的广播机制与矩阵乘法：彻底厘清常见混淆

花韻仙語

发布时间：2025-12-29 20:59:02

637人浏览过

来源于php中文网

原创

PyTorch 中的广播机制与矩阵乘法：彻底厘清常见混淆

pytorch 的 broadcasting 并不适用于任意形状张量的逐元素运算（如 `+`），也不等同于矩阵乘法的维度兼容性；它仅在满足特定对齐规则时自动扩展维度，而 `x + y` 报错正是因为二者形状不满足广播条件。

在 PyTorch（以及 NumPy）中，“broadcasting” 是一种逐元素（element-wise）运算的自动形状适配机制，其核心规则是：从末尾维度（rightmost）开始对齐，两个张量在每个维度上必须满足——要么尺寸相等，要么其中一方为 1（可被“拉伸”）。不满足该规则的操作会直接报错，绝不会触发广播。

以你的代码为例：

import torch

X = torch.tensor([[1, 5, 2, 7],    # shape: (2, 4)
                  [8, 2, 5, 3]])

Y = torch.tensor([[2, 9],          # shape: (4, 2)
                  [11, 4],
                  [9, 2],
                  [22, 7]])

执行 X + Y 时，PyTorch 尝试按 broadcasting 规则对齐维度：

X 的形状为 (2, 4)，Y 为 (4, 2)；
右对齐后：X: (2, 4) vs Y: (4, 2)；
最后一维：4 ≠ 2，且均不为 1 → 不兼容；
倒数第二维：2 ≠ 4，且均不为 1 → 仍不兼容。

因此报错信息 The size of tensor a (4) must match the size of tensor b (2) at non-singleton dimension 1 正是指出：在维度 1（即第 2 个轴，0-indexed）上，X 的大小为 4，Y 的大小为 2，无法广播。

⚠️ 注意：这与矩阵乘法（torch.matmul）完全无关。你提到“X=2×4、Y=4×2，行列匹配”，这确实是矩阵乘法的合法输入，但 + 运算符永远不会执行矩阵乘法——它只做逐元素加法。若要实现矩阵乘，必须显式调用：

法语写作助手

法语助手旗下的AI智能写作平台，支持语法、拼写自动纠错，一键改写、润色你的法语作文。

下载

result = torch.matmul(X, Y)  # ✅ 正确：输出 shape (2, 2)
print(result)
# tensor([[229,  82],
#         [149, 111]])

✅ 广播的正确示例（来自官方文档风格）：

# 满足广播规则：(5, 1, 4, 1) + (   3, 1, 1) → 自动扩展为 (5, 3, 4, 1)
x = torch.empty(5, 1, 4, 1)
y = torch.empty(   3, 1, 1)
print((x + y).shape)  # torch.Size([5, 3, 4, 1])

? 进阶提示：torch.matmul 在高维场景下也支持隐式广播（batch broadcasting）——例如当 X 为 (1, 2, 4)、Y 为 (4, 2) 时，Y 会被广播为 (1, 4, 2)，结果为 (1, 2, 2)。但这属于 matmul 的批处理行为，不是 + 运算的 broadcasting。

? 总结：

+, -, *, / 等运算符严格遵循 broadcasting 规则，不兼容即报错；
矩阵乘法必须用 torch.matmul()（或 @ 运算符），其维度要求是“内维一致”（X @ Y 要求 X.shape[-1] == Y.shape[-2]）；
切勿将线性代数的“可乘性”与 broadcasting 的“可加性”混淆——它们是正交的概念，服务于不同运算目的。

Python TensorFlow对比PyTorch_Python TensorFlow和PyTorch在机器学习中的差异

Python PyTorch模型训练_Python PyTorch如何训练和优化深度学习模型

Python PyTorch张量操作_Python怎么用PyTorch进行张量计算和自动求导

Python PyTorch入门教程_Python PyTorch是什么以及如何构建神经网络

Python深度学习如何在自定义数据集上训练检测模型【指导】

相关标签:

pytorch batch numpy 运算符 pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Django 图片上传完整教程：从表单提交到媒体文件存储下一篇：如何在 GraphQL 中正确合并多个命名操作的 DocumentNode

作者最新文章

在 Go 中无需手动编写 String() 方法即可自动生成枚举名称映射

2025-12-27 13:42

如何在 Android 中正确处理相机拍照并避免未拍摄时生成空图片文件

2025-12-27 13:47

如何在 React 中正确捕获并显示 Fetch 请求返回的 400 错误详情

2025-12-27 13:49

Go 中正确读取管道流数据的实践方法

2025-12-27 13:51

如何在 Go 中使用变量中的字符串键安全访问 map 元素

2025-12-27 13:54

《赛马娘》玩家呼吁加入美国赛马界官方似乎正在酝酿中

2025-12-27 13:57

《逃离塔科夫》遭大规模账号重置！玩家、主播损失惨重

2025-12-27 14:06

《死亡森林》重制版登陆Switch 经典恐怖冒险

2025-12-27 14:07

《最终幻想》大调查？SE官方反馈问卷正式上线

2025-12-27 14:08

如何在 React 中通过点击事件从子组件向父组件安全传递表单校验状态

2025-12-27 14:08

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1431

2023.10.24

Go语言中的运算符有哪些

Go语言中的运算符有：1、加法运算符；2、减法运算符；3、乘法运算符；4、除法运算符；5、取余运算符；6、比较运算符；7、位运算符；8、按位与运算符；9、按位或运算符；10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

221

2024.02.23

php三元运算符用法

本专题整合了php三元运算符相关教程，阅读专题下面的文章了解更多详细内容。

2025.10.17

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

428

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22