这段代码的输出结果是 y 为 array([1]),而 z 为 1。 为什么会出现这种差异呢?
当 NumPy ndarray 接收到一个索引时,它会检查索引的类型。如果索引是一个整数,NumPy 会直接使用这个整数作为索引来访问数组中的元素。如果索引是一个数组,NumPy 会根据数组的形状和内容来执行不同的操作。
在上面的例子中,np.array([1]) 是一个形状为 (1,) 的 NumPy 数组。当 NumPy 使用这个数组作为索引时,它会将其视为一个“花式索引”(fancy indexing)。 花式索引会返回一个新的数组,其中包含原始数组中由索引数组指定位置的元素。因此,x[np.array([1])] 返回的是一个新的数组 array([1]),其中包含 x 中索引为 1 的元素。
与 NumPy 不同,PyTorch Tensor 在处理索引时,会尝试将索引转换为一个整数。如果索引是一个只包含单个元素的 Tensor,PyTorch 会调用其 __index__() 方法将其转换为一个 Python 整数。
>>> torch.tensor([1]).__index__() 1 >>> torch.tensor([1, 2]).__index__() Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: only integer tensors of a single element can be converted to an index
在上面的例子中,th.tensor([1]) 是一个形状为 (1,) 的 PyTorch Tensor。由于它只包含一个元素,PyTorch 可以将其转换为整数 1。因此,x[th.tensor([1])] 实际上等同于 x[1],返回的是 x 中索引为 1 的元素,即 1。
NumPy 的源码中,有一段关键的代码片段解释了其处理索引的逻辑:
if (PyLong_CheckExact(obj) || !PyArray_Check(obj)) { // it calls PyNumber_Index() internally npy_intp ind = PyArray_PyIntAsIntp(obj); if (error_converting(ind)) { PyErr_Clear(); } else { index_type |= HAS_INTEGER; indices[curr_idx].object = NULL; indices[curr_idx].value = ind; indices[curr_idx].type = HAS_INTEGER; used_ndim += 1; new_ndim += 0; curr_idx += 1; continue; } }
这段代码表明,如果索引对象不是 NumPy 数组,或者是一个 Python 整数,NumPy 会尝试将其转换为一个整数索引。如果转换成功,NumPy 就会使用这个整数索引来访问数组中的元素。如果转换失败,NumPy 可能会引发一个错误。
NumPy ndarray 和 PyTorch Tensor 在处理 (1,) 形状的数组或张量作为索引时,行为存在差异。NumPy 将其视为花式索引,返回一个新的数组,而 PyTorch 会尝试将其转换为整数索引。
在编写代码时,需要注意这种差异,以避免潜在的错误。如果希望使用 NumPy 的花式索引,需要确保索引是一个 NumPy 数组。如果希望使用 PyTorch 的整数索引,需要确保索引是一个只包含单个元素的 Tensor。
理解这些差异有助于编写更健壮和可预测的代码,并避免在使用 NumPy 和 PyTorch 进行数据处理时出现意外行为。
以上就是NumPy ndarray 与 PyTorch Tensor 索引的差异解析的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号