NumPy数组乘法详解：*运算符与np.dot()的区别与应用

霞舞

发布时间：2025-11-26 11:41:53

697人浏览过

来源于php中文网

原创

NumPy数组乘法详解：*运算符与np.dot()的区别与应用

本文深入探讨numpy数组乘法中`*`运算符与`np.dot()`/`np.matmul()`函数的关键区别。`*`运算符执行元素级乘法，并遵循numpy的广播机制；而`np.dot()`和`np.matmul()`则用于执行矩阵乘法或点积。理解这两种操作的内在逻辑和适用场景，以及如何通过重塑数组来满足不同乘法运算的要求，对于高效、准确地使用numpy至关重要。

在NumPy中进行数组乘法时，初学者常常会对*运算符和np.dot()（或np.matmul()）函数的行为感到困惑。这两种乘法操作虽然都涉及数组元素，但其数学含义和执行机制截然不同。正确区分并应用它们，是掌握NumPy高级功能的基础。

1. NumPy中的元素级乘法 (* 运算符)

*运算符在NumPy中执行的是元素级（element-wise）乘法。这意味着它会将两个数组中对应位置的元素进行相乘，并返回一个新的数组。为了使这种操作成为可能，两个数组必须具有兼容的形状。NumPy通过其强大的广播（broadcasting）机制来处理形状不匹配的数组。

广播机制

广播机制允许NumPy在执行算术运算时，自动扩展较小数组的形状，使其与较大数组的形状兼容。广播遵循一系列规则：

如果两个数组的维度数不同，那么维度较小的数组的形状会在其前面填充1，直到它们的维度数相同。
从最后一个维度开始，逐个比较两个数组的维度。如果维度相等，或者其中一个维度为1，则它们是兼容的。
如果某个维度不兼容（即不相等且都不为1），则会引发错误。

示例分析

考虑以下两个NumPy数组：

import numpy as np

a = np.array([1, 2, 3])  # 形状: (3,)
b = np.array([[1]])      # 形状: (1,1)

当我们尝试执行 a * b 时，NumPy会应用广播规则：

维度填充: a 是1维数组，b 是2维数组。a 会被视为 (1, 3)。
形状比较:
- a 的形状: (1, 3)
- b 的形状: (1, 1)
- 从右往左比较：
  - 最后一个维度：3 和 1。兼容（其中一个为1）。
  - 倒数第二个维度：1 和 1。兼容（相等）。
广播过程: b 的 1 会沿着其第二个维度（列）广播3次，使其成为 [[1, 1, 1]]。a 的 [1, 2, 3] 会沿着其第一个维度（行）广播1次，使其成为 [[1, 2, 3]]。
元素级乘法: [[1, 2, 3]] * [[1, 1, 1]] 结果为 [[1*1, 2*1, 3*1]] 即 [[1, 2, 3]]。

result_element_wise = a * b
print(f"a 的形状: {a.shape}")
print(f"b 的形状: {b.shape}")
print(f"a * b 的结果: {result_element_wise}")
print(f"a * b 的结果形状: {result_element_wise.shape}")
# 输出:
# a 的形状: (3,)
# b 的形状: (1,1)
# a * b 的结果: [[1 2 3]]
# a * b 的结果形状: (1, 3)

这解释了为什么 a * b 会得到 [[1, 2, 3]]。

2. NumPy中的矩阵乘法 (np.dot() 和 np.matmul())

如果你的目标是执行线性代数中的矩阵乘法（或点积），那么应该使用 np.dot() 或 np.matmul() 函数。这两个函数在大多数情况下行为相似，但在处理多维数组时略有不同（np.matmul() 对堆叠矩阵乘法更友好）。

矩阵乘法规则

对于矩阵乘法 A @ B (或 np.dot(A, B)), 假设 A 的形状是 (m, n)，B 的形状是 (n, p)，那么结果矩阵的形状将是 (m, p)。关键在于第一个矩阵的列数必须等于第二个矩阵的行数。

AI Content Detector

Writer推出的AI内容检测工具

下载

实现期望结果

用户期望的结果是 [[1],[2],[3]]，这是一个形状为 (3,1) 的矩阵。要实现这个结果，我们需要将 a 数组转换为一个列向量（形状为 (3,1)），然后与 b 数组进行矩阵乘法。

a_reshaped = a.reshape(3, 1) # 将 a 转换为列向量
print(f"重塑后 a 的形状: {a_reshaped.shape}")

# 使用 np.dot 进行矩阵乘法
result_dot_product = np.dot(a_reshaped, b)
print(f"np.dot(a_reshaped, b) 的结果: {result_dot_product}")
print(f"np.dot(a_reshaped, b) 的结果形状: {result_dot_product.shape}")

# 使用 np.matmul 也可以
result_matmul = np.matmul(a_reshaped, b)
print(f"np.matmul(a_reshaped, b) 的结果: {result_matmul}")
print(f"np.matmul(a_reshaped, b) 的结果形状: {result_matmul.shape}")

# 输出:
# 重塑后 a 的形状: (3, 1)
# np.dot(a_reshaped, b) 的结果:
# [[1]
#  [2]
#  [3]]
# np.dot(a_reshaped, b) 的结果形状: (3, 1)
# np.matmul(a_reshaped, b) 的结果:
# [[1]
#  [2]
#  [3]]
# np.matmul(a_reshaped, b) 的结果形状: (3, 1)

通过将 a 重塑为 (3,1)，我们成功地进行了矩阵乘法，得到了期望的 (3,1) 形状的数组。

3. 特殊情况与注意事项

在上述示例中，有一个值得注意的特殊情况：在将 a 重塑为 (3,1) 后，如果继续使用 * 运算符，它竟然也给出了与 np.dot() 相同的结果！

a_reshaped = a.reshape(3, 1) # 形状: (3,1)
b = np.array([[1]])          # 形状: (1,1)

result_element_wise_reshaped = a_reshaped * b
print(f"a_reshaped * b 的结果: {result_element_wise_reshaped}")
print(f"a_reshaped * b 的结果形状: {result_element_wise_reshaped.shape}")

# 输出:
# a_reshaped * b 的结果:
# [[1]
#  [2]
#  [3]]
# a_reshaped * b 的结果形状: (3, 1)

为什么会这样？同样是广播机制在起作用：

a_reshaped 形状: (3, 1)
b 形状: (1, 1)
从右往左比较：
- 最后一个维度：1 和 1。兼容。
- 倒数第二个维度：3 和 1。兼容（其中一个为1）。
广播过程: b 的 1 会沿着其第一个维度（行）广播3次，使其成为 [[1],[1],[1]]。
元素级乘法: [[1],[2],[3]] * [[1],[1],[1]] 结果为 [[1*1],[2*1],[3*1]] 即 [[1],[2],[3]]。

重要提示：

尽管在这个特定例子中，重塑后的 a_reshaped * b 与 np.dot(a_reshaped, b) 得到了相同的结果，但这仅仅是巧合，并且是广播规则在特定形状下产生的副作用。