NumPy数组的随机化平铺：高效生成乱序重复序列

霞舞

发布时间：2025-07-31 15:12:39

507人浏览过

来源于php中文网

原创

numpy数组的随机化平铺：高效生成乱序重复序列

本文深入探讨如何在NumPy中高效地将一个基础数组重复平铺多次，同时确保每次平铺的元素顺序都是随机打乱的。通过介绍np.random.permutation和np.concatenate等核心函数，本文提供了一种简洁且性能良好的实现方案，适用于数据增强、蒙特卡洛模拟等多种需要随机化序列的场景。

在数据处理和科学计算中，我们经常会遇到需要重复使用一个数据集的场景。然而，有时我们不仅需要简单地重复数据，还希望每次重复（或称“平铺”）时，原始数据集的内部元素顺序是随机打乱的。例如，在机器学习的数据增强、蒙特卡洛模拟或测试场景中，这种需求尤为常见。本教程将详细介绍如何利用NumPy库的强大功能，高效地实现数组的随机化平铺。

核心实现方法：基于随机排列与数组拼接

要实现数组的随机化平铺，其核心思想是为每次平铺生成原始数组的一个随机排列（即乱序副本），然后将这些独立的乱序副本依次拼接起来。NumPy提供了两个非常适合完成此任务的关键函数：np.random.permutation() 和 np.concatenate()。

np.random.permutation(x): 这个函数会返回一个序列x的随机排列。如果x是一个整数，它将返回np.arange(x)的随机排列；如果x是一个数组，它将返回x的一个随机排列副本。关键在于，它直接返回一个新的、已打乱顺序的数组，无需先进行复制再原地打乱。
np.concatenate(arrays, axis=0): 这个函数用于沿指定轴连接一系列数组。在这里，我们将使用它来将所有独立的、已随机化的数组片段拼接成一个单一的、更大的数组。

结合这两个函数，我们可以构建一个简洁而高效的解决方案。

示例代码

假设我们有一个NumPy数组 A = np.array([1, 2, 3, 4, 5])，我们希望将其随机平铺5次。

Giiso写作机器人

Giiso写作机器人，让写作更简单

下载

import numpy as np

# 原始数组
A = np.array([1, 2, 3, 4, 5])

# 定义平铺次数
num_tiles = 5

# 使用列表推导式生成每个随机排列的平铺块
# np.random.permutation(A) 会返回A的一个随机排列副本
shuffled_tiles = [np.random.permutation(A) for _ in range(num_tiles)]

# 将所有随机排列的平铺块拼接起来
B = np.concatenate(shuffled_tiles)

print("原始数组 A:", A)
print("随机平铺后的数组 B:", B)

# 示例输出可能为：
# 原始数组 A: [1 2 3 4 5]
# 随机平铺后的数组 B: [3 1 4 5 2 4 1 5 3 2 5 4 3 2 1 2 1 5 4 3 1 3 4 5 2]

在上述代码中：

[np.random.permutation(A) for _ in range(num_tiles)] 这一行是核心。它在一个循环中执行 num_tiles 次 np.random.permutation(A)，每次都生成 A 的一个全新随机排列。这些排列被收集到一个列表中。
np.concatenate(shuffled_tiles) 随后将这个列表中的所有NumPy数组（即各个随机排列的平铺块）沿着默认轴（0轴，垂直方向）连接起来，形成最终的、随机化平铺后的数组 B。

性能考量与最佳实践

效率: np.random.permutation() 是一个经过优化的NumPy函数，执行效率很高。结合列表推导式和 np.concatenate()，这种方法对于中等大小的数组和合理的平铺次数来说，性能表现非常出色。根据测试，对于一个包含5个元素的数组平铺5次，通常耗时在微秒级别。
内存使用: 这种方法会创建 num_tiles 个原始数组大小的副本，然后将它们拼接。对于极大的原始数组或非常高的平铺次数，需要注意潜在的内存消耗。然而，对于大多数常见应用场景，这种消耗是可接受的。
简洁性: 相较于手动复制数组再原地打乱（例如使用 arr.copy() 和 np.random.shuffle(arr_copy)），np.random.permutation() 的使用更为简洁直观，因为它直接返回一个新数组，避免了对原始数据的意外修改。

总结

通过巧妙地结合 np.random.permutation() 和 np.concatenate()，我们能够高效且优雅地在NumPy中实现数组的随机化平铺。这种技术在需要生成多样化、随机序列的场景中非常有用，例如在构建机器学习数据集、进行统计模拟或生成测试数据时。理解并掌握这种模式，将有助于您更灵活地处理和生成各种复杂的数据结构。

pydantic v2 如何让字段在序列化时完全忽略（不输出到 JSON）

Python 函数式风格是否适合业务代码？

如何批量请求多个 URL 并将结果汇总保存为 CSV 文件

如何在线性时间内求解特定递推结构中的最大元素

pandas merge 时只保留左表所有行但右表只匹配部分列

相关标签:

排列 numpy函数 numpy Array for 循环数据结构 copy

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：NumPy数组元素随机化平铺与拼接实践下一篇：理解与解决Selenium自动化中的登录问题：为什么您的爬虫机器人总要求登录？

作者最新文章

如何将 JSON 对象转换为 PHP 关联数组并安全访问数据

2026-01-21 09:57

日本一城市启用驱熊无人机系统，应对创纪录人熊冲突

2026-01-21 10:07

如何让 Bootstrap 登录页填满全屏并正确居中显示

2026-01-21 10:15

Cordova Android 应用保持沉浸模式并正确适配软键盘的完整解决方案

2026-01-21 10:15

Laravel 8 多语言 JSON 本地化失效的正确实现方案

2026-01-21 10:16

小红书私信禁言申诉内容怎么写？禁言多久会自动解除？

2026-01-21 10:22

如何在数据库表可能被修改时安全地缓存 SQL 查询结果

2026-01-21 10:22

IndexedDB 索引未找到错误的完整解决方案

2026-01-21 10:24

Linux JNI库加载失败的根源与解决方案

2026-01-21 10:28

抖音私信获客怎么做链接？获客链接靠谱吗？

2026-01-21 10:32

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

536

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06

treenode的用法

536

2023.12.01

C++ 高效算法与数据结构

2025.12.22

深入理解算法：高效算法与数据结构专题

2026.01.06