
本文旨在讲解如何使用 Pandas 库将 DataFrame 从长表(long format)重塑为宽表(wide format)。通过 pivot 和 stack 函数的组合使用,可以灵活地转换数据结构,满足不同的数据分析需求。本文将提供详细的代码示例和解释,帮助读者掌握这一关键的数据处理技巧。
在数据分析中,经常需要对 DataFrame 的结构进行调整,以便更好地进行数据分析和可视化。其中一种常见的操作就是将长表转换为宽表。长表通常包含多个重复的索引列,而宽表则将这些索引列转换为列名,使得数据更加紧凑和易于理解。
Pandas 提供了多种方法来实现 DataFrame 的重塑,本文将重点介绍使用 pivot 和 stack 函数的组合方法。
假设我们有以下 DataFrame:
import pandas as pd
data = {'Date': [1, 1, 1],
'Item': [1, 2, 3],
'A': ['a1', 'a2', 'a3'],
'B': ['b1', 'b2', 'b3']}
df = pd.DataFrame(data)
print(df)输出:
Date Item A B 0 1 1 a1 b1 1 1 2 a2 b2 2 1 3 a3 b3
我们的目标是将其转换为以下宽表格式:
Date Letter Item 1 Item 2 Item 3 0 1 A a1 a2 a3 1 1 B b1 b2 b3
可以使用以下代码实现:
out = (df.pivot(columns='Item', index='Date').stack(0)
.add_prefix('Item ').reset_index(names=['Date', 'Letter']))
print(out)输出:
Date Letter Item 1 Item 2 Item 3 0 1 A a1 a2 a3 1 1 B b1 b2 b3
代码解释:
通过 pivot 和 stack 函数的组合使用,可以方便地将 Pandas DataFrame 从长表重塑为宽表。这种方法灵活且易于理解,是数据分析中常用的数据处理技巧。 在实际应用中,可以根据具体的需求调整 pivot 和 stack 函数的参数,以达到最佳的重塑效果。
以上就是使用 Pandas 进行 DataFrame 重塑:从长表到宽表的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号