将字典列表转换为按键分组的NumPy数组

DDD

发布时间：2025-11-13 14:52:21

637人浏览过

来源于php中文网

原创

将字典列表转换为按键分组的numpy数组

本文详细介绍了如何将一个包含多个单键字典的列表，高效地转换为一个以原字典键为索引、值为对应NumPy数组的字典结构。通过迭代分组和类型转换两步，实现数据从扁平化字典列表到按类别聚合的数值数组的重塑，这对于数据预处理和分析任务至关重要。

在数据处理和分析的场景中，我们经常会遇到需要将特定格式的原始数据转换为更适合数值计算和统计分析的结构。其中一个常见需求是将一个包含多个单键字典的列表，转换成一个以这些字典的键作为索引，值为对应键下所有数值组成的NumPy数组的字典。这种转换能够有效地将分散的数据聚合起来，为后续的科学计算提供便利。

问题描述与目标

假设我们有以下形式的Python字典列表：

data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

我们的目标是将其转换为以下结构的字典，其中每个键对应一个NumPy数组：

"Cool": np.array([128, 51])
"Hot": np.array([75, 62])
"Archive": np.array([144, 12])

这种转换的核心在于两点：首先，需要根据字典的键对数值进行分组；其次，将分组后的数值列表转换为NumPy数组。

解决方案

实现这一转换的有效方法是利用Python的字典来动态收集数据，然后统一进行类型转换。以下是具体的实现步骤和代码示例：

1. 初始化分组字典

首先，我们需要创建一个空的字典，用于存储按键分组后的数据。这个字典的键将是原始字典中的键（如 'Cool', 'Hot', 'Archive'），而值则是一个列表，用于临时收集所有对应键下的数值。

2. 遍历并分组数据

接下来，我们遍历输入的字典列表。对于列表中的每一个字典，我们提取其唯一的键和值。然后，检查这个键是否已经存在于我们之前创建的分组字典中：

知了追踪

AI智能信息助手，智能追踪你的兴趣资讯

下载

如果键已存在，说明之前已经遇到过这个类别的数值，我们将当前值追加到对应的列表中。
如果键不存在，说明这是第一次遇到这个类别的数值，我们将在分组字典中为这个新键创建一个新的列表，并将当前值作为列表的第一个元素。

3. 转换为NumPy数组

完成所有数据的分组后，分组字典中的每个值都是一个Python列表。为了满足最终输出NumPy数组的要求，我们需要再次遍历分组字典，将每个列表值转换为NumPy数组。

完整代码示例

import numpy as np

# 原始数据列表
data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]

# 步骤1: 初始化一个空字典用于分组
grouped_data = {}

# 步骤2: 遍历数据并进行分组
for item in data:
    for key, value in item.items(): # 每个字典只有一个键值对
        if key in grouped_data:
            grouped_data[key].append(value)
        else:
            grouped_data[key] = [value]

# 步骤3: 将分组后的列表转换为NumPy数组
for key in grouped_data:
    grouped_data[key] = np.array(grouped_data[key])

# 打印结果以验证
print("转换后的数据结构：")
for key, value in grouped_data.items():
    print(f'"{key}": {value}')

# 输出示例：
# "Cool": [128 51]
# "Hot": [75 62]
# "Archive": [144 12]

注意事项与优化

数据结构假设：本教程假设输入的字典列表中，每个字典都只包含一个键值对。如果字典可能包含多个键值对，则需要根据实际需求调整内部循环逻辑，例如决定如何处理多余的键值对。

效率考量：对于非常大的数据集，重复的 if key in grouped_data 检查和列表的 append 操作可能会有轻微的性能开销。在这种情况下，可以考虑使用 collections.defaultdict 来简化分组逻辑，它可以在访问不存在的键时自动创建一个默认值（例如一个空列表），从而省去条件判断。

from collections import defaultdict
import numpy as np

data = [{'Cool': 128}, {'Cool': 51}, {'Hot': 75}, {'Hot': 62}, {'Archive': 144}, {'Archive': 12}]
grouped_data_defaultdict = defaultdict(list)

for item in data:
    for key, value in item.items():
        grouped_data_defaultdict[key].append(value)

# 转换为普通字典和NumPy数组
final_grouped_data = {key: np.array(value) for key, value in grouped_data_defaultdict.items()}

print("\n使用 defaultdict 转换后的数据结构：")
for key, value in final_grouped_data.items():
    print(f'"{key}": {value}')

defaultdict 的方法更加简洁和Pythonic，尤其是在分组逻辑中。

错误处理：如果输入数据中可能包含非数值类型的值，np.array() 可能会尝试将其转换为字符串数组或引发错误。在实际应用中，可能需要添加类型检查或数据清洗步骤。

总结

将字典列表转换为按键分组的NumPy数组是数据预处理中的一项基本操作。通过本文介绍的迭代分组和类型转换方法，无论是使用标准字典还是 collections.defaultdict，都可以高效且清晰地完成这一任务。选择哪种方法取决于个人偏好和对代码简洁性的要求，但核心思想都是先按键聚合数据，再统一转换为NumPy数组，为后续的数值分析工作奠定基础。

标题：Python 日志配置的动态合并：字典默认配置与外部文件覆盖的优雅实践

Python 中实现单实例应用并等待前一个实例完成的完整方案

Python 中实现单实例应用并等待前一个实例结束的完整方案

如何高效统计字符串中出现的唯一排列子串数量

如何修改 Python 中的元组元素？

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

755

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

759

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

708

2023.08.11