使用 Pandas 将多行多列数据合并为单行

碧海醫心
发布: 2025-09-03 20:14:12
原创
634人浏览过

使用 pandas 将多行多列数据合并为单行

本文旨在介绍如何使用 Pandas 库将 DataFrame 中具有对应关系的多个 Position/Name 列合并为单行,并根据 Position 列的值筛选出有效数据。通过 stack、where、dropna 等 Pandas 函数的组合运用,可以高效地实现数据转换和清洗,最终得到目标格式的数据。

数据准备

首先,我们需要创建一个 Pandas DataFrame,模拟原始数据。以下是一个示例:

import pandas as pd

data = {'Position A': [-1, 3, -1, -1],
        'Name A': ['tortise', 'sprite', 'nope', 'nope'],
        'Position B': [-1, 2, -1, -1],
        'Name B': ['monkey', 'coffee', 'nope', 'nope'],
        'Position C': [2, -1, -1, -1],
        'Name C': ['coca cola', 'bird', 'fish', 'nope'],
        'Position D': [-1, -1, 5, -1],
        'Name D': ['slug', 'monkey', 'root beer', 'nope'],
        'Position E': [-1, -1, 1, -1],
        'Name E': ['rooster', 'ostrich', 'tea', 'nope']}

df = pd.DataFrame(data)

print(df)
登录后复制

这段代码创建了一个名为 df 的 DataFrame,包含了 Position 和 Name 列,模拟了原始数据。

数据转换

核心思路是使用 stack 函数将 DataFrame 转换为 Series,然后根据 Position 列的值进行筛选,最后再将 Series 转换回 DataFrame。

new_df = (df.filter(like='Name').stack()
          .where(df.filter(like='Position').stack().ne(-1).values)
          .dropna().droplevel(0).sort_index().to_frame().T
)

print(new_df)
登录后复制

这段代码主要做了以下几件事:

行者AI
行者AI

行者AI绘图创作,唤醒新的灵感,创造更多可能

行者AI 100
查看详情 行者AI
  1. df.filter(like='Name'): 筛选出包含 'Name' 的列。
  2. .stack(): 将筛选出的列堆叠成一个 Series。
  3. df.filter(like='Position').stack().ne(-1).values: 筛选出包含 'Position' 的列,堆叠成 Series,并判断值是否不等于 -1,将结果转换为 Numpy 数组。
  4. .where(...): 根据 Position 列的条件,保留 Name 列中满足条件的值,否则设置为 NaN。
  5. .dropna(): 移除 NaN 值。
  6. .droplevel(0): 移除最外层的索引。
  7. .sort_index(): 对索引进行排序。
  8. .to_frame().T: 将 Series 转换为 DataFrame,并转置。

结果展示

运行上述代码后,将会得到以下结果:

    Name A   Name B      Name C     Name D  Name E
0   sprite   coffee   coca cola  root beer     tea
登录后复制

这正是我们期望的结果,将多行多列的数据合并为了单行,并根据 Position 列的值进行了筛选。

注意事项

  • 确保 Position 和 Name 列的对应关系正确。
  • 可以根据实际情况调整筛选条件,例如,将 -1 替换为其他值。
  • 如果数据量很大,可以考虑使用更高效的 Pandas 函数,例如 apply。

总结

本文介绍了如何使用 Pandas 将 DataFrame 中具有对应关系的多个 Position/Name 列合并为单行,并根据 Position 列的值筛选出有效数据。通过 stack、where、dropna 等 Pandas 函数的组合运用,可以高效地实现数据转换和清洗。这种方法可以应用于各种需要将多行多列数据合并为单行的场景,例如,数据清洗、数据转换、数据分析等。掌握这种方法可以帮助你更高效地处理数据,提高工作效率。

以上就是使用 Pandas 将多行多列数据合并为单行的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号