numpy通过ndarray对象实现高效数组操作,提升计算速度。其核心包括:1. 创建数组的方法有np.array()、np.zeros()、np.ones()、np.empty()、np.arange()、np.linspace()及随机函数;2. 索引和切片支持基本索引、布尔索引、花式索引等;3. 数组运算涵盖算术、比较、逻辑运算及通用函数如np.sin()、np.exp();4. 广播机制允许不同形状数组运算,遵循维度数对齐、自动补1、大小匹配规则;5. 线性代数运算通过numpy.linalg模块实现,包括矩阵求逆、行列式、特征值、解方程组等;6. 性能优化技巧包括避免循环、选择合适数据类型、利用广播、使用内置函数、内存视图等。

NumPy,Python科学计算的基石,本质上就是对数组进行高效操作。它简化了向量化操作,避免了繁琐的循环,大幅提升了计算速度。掌握NumPy,你就能更轻松地驾驭数据分析、机器学习等任务。

NumPy的核心在于ndarray对象,也就是多维数组。理解它的创建、索引、切片、运算,基本上就掌握了NumPy的精髓。

创建数组:
立即学习“Python免费学习笔记(深入)”;
-
np.array():从Python列表或元组创建。这是最常用的方法,灵活方便。 -
np.zeros()、np.ones()、np.empty():创建指定形状的全零、全一或未初始化数组。适合预分配内存。 -
np.arange():类似于Python的range(),创建等差数组。 -
np.linspace():创建指定范围内指定数量的等间隔数组。 -
np.random.rand()、np.random.randn():创建随机数组。
索引和切片:

NumPy的索引和切片非常强大,支持多维索引、布尔索引、花式索引等。
- 基本索引:与Python列表类似,
arr[0]、arr[1, 2]。 - 切片:
arr[1:5]、arr[:, 1:3]。 - 布尔索引:
arr[arr > 5],根据条件筛选元素。 - 花式索引:
arr[[1, 3, 5]],选择指定索引的元素。
数组运算:
NumPy支持向量化运算,即对整个数组进行运算,而无需循环。
- 算术运算:
+、-、*、/、**。 - 比较运算:
>、、==、!=。 - 逻辑运算:
&、|、~。 - 通用函数(ufunc):
np.sin()、np.cos()、np.exp()、np.log()。
广播机制:
NumPy的广播机制允许不同形状的数组进行运算。较小的数组会自动“广播”到较大的数组的形状,使其兼容。理解广播机制是高效使用NumPy的关键。
NumPy数组和Python列表的区别?
Python列表可以存储不同类型的数据,而NumPy数组只能存储相同类型的数据。NumPy数组在内存中是连续存储的,而Python列表不是。这使得NumPy数组的运算速度远快于Python列表。另外,NumPy提供了丰富的数学函数和线性代数运算,而Python列表没有。
NumPy数组的形状(shape)和维度(ndim)有什么区别?
形状表示数组的每个维度的大小,例如(3, 4)表示一个3行4列的二维数组。维度表示数组的轴数,例如二维数组的维度是2。你可以使用arr.shape和arr.ndim来获取数组的形状和维度。
如何改变NumPy数组的形状?
可以使用np.reshape()函数改变数组的形状。例如,arr.reshape((2, 6))将一个12个元素的数组变成一个2行6列的数组。注意,新的形状必须与数组的元素个数匹配。另外,np.flatten()可以将多维数组展平成一维数组。
NumPy的广播机制是如何工作的?
广播机制允许不同形状的数组进行运算。它遵循以下规则:
- 如果两个数组的维度数不同,则维度数较小的数组会在其形状的前面补1,直到维度数相同。
- 如果两个数组的形状在任何一个维度上都不匹配,并且其中一个数组在该维度上的大小为1,则该数组会在该维度上进行广播,使其大小与另一个数组匹配。
- 如果在任何一个维度上,两个数组的大小都既不相等,也不有一个等于1,则会引发
ValueError。
掌握了这些规则,你就能更好地理解和利用广播机制。
如何使用NumPy进行线性代数运算?
NumPy提供了numpy.linalg模块,用于进行线性代数运算。
-
np.linalg.inv():求矩阵的逆。 -
np.linalg.det():求矩阵的行列式。 -
np.linalg.eig():求矩阵的特征值和特征向量。 -
np.linalg.solve():求解线性方程组。 -
np.dot():矩阵乘法。
这些函数可以帮助你进行各种线性代数计算。
NumPy的性能优化技巧有哪些?
- 避免循环:尽量使用向量化运算,避免使用Python循环。
- 选择合适的数据类型:使用
dtype参数指定合适的数据类型,减少内存占用和计算时间。 - 利用广播机制:合理利用广播机制,避免不必要的内存复制。
- 使用NumPy的内置函数:NumPy的内置函数经过优化,性能通常优于手写的Python代码。
- 使用内存视图:使用切片创建数组的内存视图,避免复制数据。
合理应用这些技巧,可以显著提升NumPy代码的性能。










