使用 Pandas 统计 DataFrame 字典列中列表首个元素的非空值数量

DDD

发布时间：2025-08-02 15:28:02

712人浏览过

来源于php中文网

原创

使用 pandas 统计 dataframe 字典列中列表首个元素的非空值数量

本文介绍了如何使用 Pandas 处理包含字典和列表的 DataFrame 列，并统计特定列表（例如 'list_A'）中首个元素的非空值数量。通过 notna 函数、列表推导式以及 explode 和 groupby 方法，展示了两种高效的实现方式，并提供了详细的代码示例，帮助读者掌握处理复杂数据结构的技巧。

在数据分析中，经常会遇到 DataFrame 的某一列包含复杂的数据结构，例如字典，而字典的值又包含列表。如果需要对这些列表中的元素进行统计分析，就需要掌握一些特定的 Pandas 技巧。本文将介绍如何统计 DataFrame 中字典列的特定列表（例如 'list_A'）中，首个元素的非空值数量。

方法一：使用列表推导式和 notna 函数

这种方法的核心是使用列表推导式提取每个字典中 'list_A' 的第一个元素，然后使用 pd.notna 函数判断是否为空值，最后使用 sum 函数统计非空值的数量。

import pandas as pd

data = [{"list_A": [2.93, 4.18, 4.18, None, 1.57, 1.57, 3.92, 6.27, 2.09, 3.14, 0.42, 2.09],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]},
        {"list_A": [2.51, 3.58, 3.58, None, 1.34, 1.34, 3.36, 5.37, 1.79, 2.69, 0.36, 1.79],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]},
        {"list_A": [None, 5.94, 5.94, None, 2.23, 2.23, 5.57, 8.9, 2.97, 4.45, 0.59, 2.97],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]}]

# 创建一个 DataFrame，其中包含一个名为 "column_dic" 的列
df = pd.DataFrame({"column_dic": [data]})

df['count_first_item'] = [pd.notna([y['list_A'][0] for y in x]).sum()
                          for x in df['column_dic']]
print(df)

这段代码首先创建了一个 DataFrame，其中 column_dic 列包含一个包含多个字典的列表。然后，使用列表推导式 [y['list_A'][0] for y in x] 提取每个字典中 'list_A' 的第一个元素。pd.notna() 函数判断这些元素是否为非空值，返回一个布尔值列表。最后，sum() 函数将 True (非空值) 的数量加总，得到非空值的总数，并将结果赋值给新的列 count_first_item。

Shakespeare

一款人工智能文案软件，能够创建几乎任何类型的文案。

下载

方法二：使用 explode、str.get 和 groupby 函数

这种方法利用了 Pandas 的 explode 函数将列表展开，然后使用 str.get 函数获取 'list_A' 列表，再使用 str[0] 获取列表的第一个元素，最后使用 groupby 函数按原始索引分组并计数非空值。

import pandas as pd

data = [{"list_A": [2.93, 4.18, 4.18, None, 1.57, 1.57, 3.92, 6.27, 2.09, 3.14, 0.42, 2.09],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]},
        {"list_A": [2.51, 3.58, 3.58, None, 1.34, 1.34, 3.36, 5.37, 1.79, 2.69, 0.36, 1.79],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]},
        {"list_A": [None, 5.94, 5.94, None, 2.23, 2.23, 5.57, 8.9, 2.97, 4.45, 0.59, 2.97],
         "list_B": [820, 3552, 7936, None, 2514, 4035, 6441, 15379, 2167, 6147, 3322, 1177]}]

# 创建一个 DataFrame，其中包含一个名为 "column_dic" 的列
df = pd.DataFrame({"column_dic": [data]})

df['count_first_item'] = (df['column_dic'].explode().str.get('list_A').str[0]
                                          .groupby(level=0).count())
print(df)

这段代码首先使用 explode() 函数将 column_dic 列中的列表展开，将每个字典变成单独的行。然后，使用 str.get('list_A') 获取每个字典中的 'list_A' 列表。接着，使用 str[0] 获取每个列表的第一个元素。最后，使用 groupby(level=0) 按照原始 DataFrame 的索引进行分组，并使用 count() 函数统计每个分组中非空值的数量。

总结

本文介绍了两种使用 Pandas 统计 DataFrame 字典列中列表首个元素的非空值数量的方法。第一种方法使用列表推导式和 notna 函数，代码简洁易懂。第二种方法使用 explode、str.get 和 groupby 函数，更加灵活，可以处理更复杂的数据结构。在实际应用中，可以根据具体情况选择合适的方法。需要注意的是，在使用 explode 函数时，要确保列表中的元素类型一致，否则可能会出现错误。

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

197

2023.11.20

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

534

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06

数据分析的方法

数据分析的方法有：对比分析法，分组分析法，预测分析法，漏斗分析法，AB测试分析法，象限分析法，公式拆解法，可行域分析法，二八分析法，假设性分析法。php中文网为大家带来了数据分析的相关知识、以及相关文章等内容。

464

2023.07.04

数据分析方法有哪几种

数据分析方法有：1、描述性统计分析；2、探索性数据分析；3、假设检验；4、回归分析；5、聚类分析。本专题为大家提供数据分析方法的相关的文章、下载、课程内容，供大家免费下载体验。

278

2023.08.07

网站建设功能有哪些

网站建设功能包括信息发布、内容管理、用户管理、搜索引擎优化、网站安全、数据分析、网站推广、响应式设计、社交媒体整合和电子商务等功能。这些功能可以帮助网站管理员创建一个具有吸引力、可用性和商业价值的网站，实现网站的目标。

724

2023.10.16

Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践，涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC（Unary/Server/Client/Bidirectional）、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例，帮助学习者掌握使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系，适用于微服务与内部系统通信场景。

2026.01.15

热门下载

网站特效

网站源码

网站素材

前端模板