numpy.matmul用于执行矩阵乘法,要求左矩阵列数等于右矩阵行数,支持多维数组按最后两维进行矩阵乘法并广播其余维度,与*(逐元素相乘)和np.dot(高维行为不同)有区别,推荐用于明确的矩阵运算,等价于@操作符。

在 Python 中,numpy.matmul 是 NumPy 提供的用于执行矩阵乘法的函数。它专为线性代数中的矩阵相乘设计,比普通的数组乘法(如 *)更符合数学意义上的矩阵乘法。
matmul 基本用法
numpy.matmul(A, B) 计算两个数组 A 和 B 的矩阵乘积。要求 A 的列数等于 B 的行数。
示例:
import numpy as npA = np.array([[1, 2],
[3, 4]])
B = np.array([[5, 6],
[7, 8]])
C = np.matmul(A, B)
print(C)
# 输出:
# [[19 22]
# [43 50]]
支持多维数组
当输入是三维或更高维数组时,matmul 沿最后两个轴进行矩阵乘法,广播其余维度。
立即学习“Python免费学习笔记(深入)”;
例如,两个形状为 (2, 3, 4) 和 (2, 4, 5) 的数组可以相乘,结果为 (2, 3, 5)。
A = np.random.rand(2, 3, 4)B = np.random.rand(2, 4, 5)
C = np.matmul(A, B)
print(C.shape) # (2, 3, 5)
与 '*' 和 dot 的区别
注意以下几点避免混淆:
- * 表示逐元素乘法(对应位置相乘),不是矩阵乘法
- np.dot 在二维情况下类似 matmul,但在高维行为略有不同,且对向量处理更灵活
- matmul 更严格遵循线性代数规则,不支持标量,推荐用于明确的矩阵乘法
常见使用建议
实际使用中注意:
- 确保参与乘法的最后两个维度满足矩阵乘法条件:(m, k) × (k, n)
- 如果需要将一维数组视为行/列向量,注意其形状影响结果
- 对于二维数组,
np.matmul(A, B)等价于A @ B,@ 是 Python 的矩阵乘法操作符
基本上就这些。掌握 matmul 能帮助你在科学计算和机器学习中正确实现线性变换、神经网络层计算等任务。











