Python怎样计算数据的累积统计量？

看不見的法師

发布时间：2025-07-18 12:06:02

719人浏览过

来源于php中文网

原创

累积统计量是逐步计算统计指标的方法，常见应用包括金融分析与销售趋势追踪。使用python的numpy和pandas库，可通过cumsum()、cumprod()及expanding().mean()等函数便捷实现。例如，pandas中的cumsum()可计算累积销售额，帮助分析销售趋势。处理缺失值时，需先填充或删除，如使用fillna()填充均值后再计算。此外，通过pandas的expanding()结合apply()可自定义计算逻辑，如加权累积和，实现灵活的数据分析需求。

Python怎样计算数据的累积统计量？

累积统计量，简单来说，就是一步一步地计算统计量，比如累积和、累积平均值等等。Python里，numpy和pandas库提供了非常方便的方法来实现这些计算。

import numpy as np
import pandas as pd

# 使用numpy计算累积和和累积积
data = np.array([1, 2, 3, 4, 5])
cumulative_sum = np.cumsum(data)
cumulative_product = np.cumprod(data)
print("Numpy累积和:", cumulative_sum)
print("Numpy累积积:", cumulative_product)

# 使用pandas计算累积和和累积均值
s = pd.Series([1, 2, 3, 4, 5])
cumulative_sum_pd = s.cumsum()
cumulative_mean_pd = s.expanding().mean() # 注意这里要用expanding()
print("Pandas累积和:", cumulative_sum_pd)
print("Pandas累积均值:", cumulative_mean_pd)

累积统计量在数据分析中有什么用？

累积统计量在很多场景下都非常有用。例如，在金融领域，可以用来分析股票价格的累积收益；在销售数据分析中，可以用来追踪累积销售额。累积统计量可以帮助我们观察数据的趋势和变化，而不仅仅是关注某个时间点的数值。

举个例子，假设你是一家电商公司的分析师，想要了解过去一年里每个月的累积销售额，就可以用累积和来分析。通过观察累积销售额的变化，你可以判断公司的整体销售趋势是上升还是下降，以及哪些月份的销售额增长最快。

立即学习“Python免费学习笔记（深入）”；

import pandas as pd

# 假设我们有每个月的销售额数据
sales_data = {'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'],
              'Sales': [100, 120, 150, 130, 160, 180, 200, 190, 220, 240, 250, 270]}
df = pd.DataFrame(sales_data)

# 计算累积销售额
df['Cumulative_Sales'] = df['Sales'].cumsum()

print(df)

这个例子展示了如何使用pandas计算累积销售额。cumsum()函数非常方便，可以快速计算出累积和。

如何处理缺失值对累积统计量的影响？

在实际数据中，经常会遇到缺失值。如果直接使用cumsum()等函数计算累积统计量，缺失值会传播到后续的计算中，导致结果不准确。因此，我们需要先处理缺失值。

常见的处理方法包括：

凡人网络购物系统 2008

凡人网络购物系统2008新增功能：1. 完善运费计算模式，设置了五种运费计算模式，管理员可以后台自由设置，包括： A. 按照订单收取运费，每个订单一个运费 B. 按照商品收取运费，运费根据客户订购的商品自动累积 C. 根据重量计算运费，根据商品重量计算运费 D. 根据商品件数计算运费 E. 不需要运费同时可以设置满一定金额免收运费；2. 界面美化，增加模板管理

下载

删除包含缺失值的行： 这种方法简单粗暴，但会丢失部分数据。
填充缺失值： 可以使用均值、中位数、或者其他合理的值来填充缺失值。
使用插值法： 根据已有的数据点，推断缺失值。

下面是一个使用均值填充缺失值的例子：

import pandas as pd
import numpy as np

# 创建包含缺失值的数据
data = {'Value': [1, 2, np.nan, 4, 5]}
df = pd.DataFrame(data)

# 使用均值填充缺失值
df['Value'].fillna(df['Value'].mean(), inplace=True)

# 计算累积和
df['Cumulative_Sum'] = df['Value'].cumsum()

print(df)

在这个例子中，我们首先使用fillna()函数，将缺失值替换为Value列的均值。然后，再计算累积和，这样就可以避免缺失值对结果的影响。

如何自定义累积统计量的计算方法？

虽然numpy和pandas提供了常用的累积统计量计算函数，但在某些情况下，我们可能需要自定义计算方法。例如，我们可能需要计算加权累积和，或者根据特定的规则来更新累积值。

pandas提供了expanding()方法，可以方便地进行自定义累积计算。expanding()方法会创建一个窗口对象，该窗口会随着数据的迭代而不断扩大。我们可以使用apply()方法，在每个窗口上应用自定义的函数。

下面是一个计算加权累积和的例子：

import pandas as pd

# 创建数据
data = {'Value': [1, 2, 3, 4, 5],
        'Weight': [0.1, 0.2, 0.3, 0.2, 0.2]}
df = pd.DataFrame(data)

# 定义加权累积和函数
def weighted_cumulative_sum(series):
    weights = df['Weight'][:len(series)]
    return (series * weights).sum()

# 使用expanding()和apply()计算加权累积和
df['Weighted_Cumulative_Sum'] = df['Value'].expanding().apply(weighted_cumulative_sum)

print(df)

在这个例子中，我们首先定义了一个weighted_cumulative_sum()函数，该函数接受一个series作为输入，并计算该series的加权和。然后，我们使用expanding()方法创建一个窗口对象，并使用apply()方法将weighted_cumulative_sum()函数应用到每个窗口上。这样就可以得到加权累积和。注意，这里有一个容易出错的点，就是权重weights的选取，需要根据当前窗口的大小进行切片。

Python 为什么允许动态增加对象属性？

Python CI 中测试为什么会变慢？

Python List[int] 在运行时是什么？

Python 类型别名的最佳实践

Python asyncio 事件循环是如何调度任务的？

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

758

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

639

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

761

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1265

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

548

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

708

2023.08.11