
本文旨在指导读者如何在 Pandas 的 pivot_table 中计算百分比,即一个数值列除以另一个数值列的结果,并将结果整合到原有的 pivot_table 中,最终展示百分比数据。我们将利用 DataFrame.xs 函数选取 MultiIndex 的数据,进行重命名和除法运算,最后将结果合并到原始 DataFrame 中。
在使用 Pandas 进行数据分析时,pivot_table 是一个强大的工具,可以对数据进行分组和聚合。 然而,有时我们需要在 pivot_table 中计算百分比,例如计算点击率(点击次数/浏览次数)。本文将介绍一种有效的方法来实现这一目标。
假设我们有一个 DataFrame,其中包含 users_who_clicked 和 users_who_viewed 两列,分别表示点击次数和浏览次数。 我们的目标是创建一个 pivot_table,并在其中添加一列,显示点击率。
以下是一种实现方法:
import pandas as pd
# 示例数据
d = {('users_who_clicked','a'): [5, 6, 7, 8],
('users_who_clicked','b'): [9, 10, 11, 12],
('users_who_viewed','a'): [4, 1, 3, 7],
('users_who_viewed','b'): [1, 3, 7, 3]}
df = pd.DataFrame(data=d)
print("Original DataFrame:\n", df)
# 1. 使用 DataFrame.xs 选取 'users_who_clicked' 列
df1 = (df.xs('users_who_clicked', axis=1, level=0, drop_level=False)
.rename(columns={'users_who_clicked':'%'}, level=0))
# 2. 使用 DataFrame.xs 选取 'users_who_viewed' 列
df2 = (df.xs('users_who_viewed', axis=1, level=0, drop_level=False)
.rename(columns={'users_who_viewed':'%'}, level=0))
# 3. 计算百分比
out = pd.concat([df, df1.div(df2)], axis=1)
print("\nDataFrame with Percentage:\n", out)代码解释:
输出结果:
Original DataFrame:
users_who_clicked users_who_viewed
a b a b
0 5 9 4 1
1 6 10 1 3
2 7 11 3 7
3 8 12 7 3
DataFrame with Percentage:
users_who_clicked users_who_viewed %
a b a b a b
0 5 9 4 1 1.250000 9.000000
1 6 10 1 3 6.000000 3.333333
2 7 11 3 7 2.333333 1.571429
3 8 12 7 3 1.142857 4.000000本文介绍了一种在 Pandas pivot_table 中计算百分比的有效方法。 通过使用 DataFrame.xs 函数选取 MultiIndex 的数据,进行重命名和除法运算,最后将结果合并到原始 DataFrame 中,我们可以轻松地在 pivot_table 中添加百分比列,从而更好地分析数据。 这种方法不仅适用于计算点击率,还可以用于计算其他类型的百分比,例如转化率、完成率等。 掌握这种方法可以帮助你更有效地使用 Pandas 进行数据分析。
以上就是Pandas Pivot Table 中计算百分比的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号