0

0

使用字典值有条件地划分 Pandas DataFrame 列

花韻仙語

花韻仙語

发布时间:2025-07-13 17:22:14

|

723人浏览过

|

来源于php中文网

原创

使用字典值有条件地划分 pandas dataframe 列

本文介绍了如何根据字典中的值有条件地划分 Pandas DataFrame 中的某一列。核心思想是利用 apply 函数结合字典的 get 方法,实现对 DataFrame 中特定行进行除法运算,而对字典中不存在对应键的行则保持原值不变。本文提供了一种简洁且高效的解决方案,并探讨了其适用场景和注意事项。

在数据处理中,经常会遇到需要根据特定条件修改 DataFrame 列的情况。其中一种常见场景是:根据 DataFrame 某一列的值,从字典中查找对应的值,并用该值对 DataFrame 的另一列进行划分。如果 DataFrame 列中的值在字典中不存在,则保持原值不变。本文将介绍如何使用 Pandas 实现这一操作。

使用 apply 函数和 get 方法

Pandas 的 apply 函数允许我们对 DataFrame 的每一行或每一列应用一个函数。结合字典的 get 方法,我们可以实现有条件划分的目的。get 方法可以安全地从字典中获取值,如果键不存在,则返回一个默认值。

以下是一个示例:

VisualizeAI
VisualizeAI

用AI把你的想法变成现实

下载
import pandas as pd

# 创建 DataFrame
df = pd.DataFrame({
  "integer_id": [1, 2, 3],
  "delta": [10, 20, 30]
})

# 创建字典
d = {1: 0.5, 3: 0.25}

# 使用 apply 函数和 get 方法进行划分
df['delta'] = df.apply(lambda r: r['delta']/d.get(r['integer_id'], 1), axis=1)

# 打印结果
print(df)

代码解释:

  1. 首先,我们创建了一个 DataFrame df,其中包含两列:integer_id 和 delta。
  2. 然后,我们创建了一个字典 d,它将 integer_id 映射到浮点数值。
  3. 关键在于 df['delta'] = df.apply(lambda r: r['delta']/d.get(r['integer_id'], 1), axis=1) 这一行代码。
    • df.apply(..., axis=1) 表示我们对 DataFrame 的每一行应用一个函数。
    • lambda r: ... 定义了一个匿名函数,该函数接受 DataFrame 的一行作为输入 (命名为 r)。
    • r['delta']/d.get(r['integer_id'], 1) 是匿名函数的核心逻辑。它首先获取当前行的 delta 值 (r['delta'])。然后,它使用 d.get(r['integer_id'], 1) 从字典 d 中获取与当前行的 integer_id 对应的值。如果 integer_id 在字典 d 中存在,则返回对应的值;否则,返回默认值 1。最后,将 delta 值除以从字典中获取的值。

注意事项:

  • 默认值: 在 d.get(r['integer_id'], 1) 中,1 是默认值。这意味着如果 integer_id 在字典 d 中不存在,delta 将除以 1,从而保持不变。根据实际需求,可以修改默认值。例如,如果希望在 integer_id 不存在时将 delta 设置为 NaN,可以将默认值设置为 float('NaN')。
  • 数据类型: 确保字典中的值与 delta 列的数据类型兼容,以避免类型错误。
  • 性能: 对于大型 DataFrame,apply 函数的性能可能不如向量化操作。如果性能是关键,可以考虑使用其他方法,例如 map 函数结合 fillna 方法。

总结

本文介绍了一种使用 apply 函数和字典的 get 方法有条件地划分 Pandas DataFrame 列的方法。这种方法简洁且易于理解,适用于各种数据处理场景。通过合理设置默认值,可以灵活地处理字典中不存在对应键的情况。在处理大型 DataFrame 时,需要注意性能问题,并考虑使用更高效的替代方案。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

51

2025.12.04

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

301

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

558

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

98

2025.10.23

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

204

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

190

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

47

2026.01.05

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号