
本文旨在解决在Pandas旧版本(如1.2.3)中使用df.rolling(n).mean(skipna=False)时,升级到Pandas 1.5+版本后出现的FutureWarning警告。通过代码示例、官方文档和源码分析,详细阐述了skipna参数在旧版本滚动窗口均值计算中的实际行为,并为用户提供平滑过渡到新版本的解决方案。
在Pandas 1.5及更高版本中,向Rolling.mean()传递额外的关键字参数(kwargs),如skipna=False,会导致FutureWarning警告。警告信息提示,这些kwargs不会对结果产生任何影响,并且在未来的Pandas版本中将会引发TypeError。然而,如何在新版本中复现旧版本中的行为,却没有明确的指导。
幸运的是,在Pandas 1.2.3中,skipna参数在滚动窗口均值计算的上下文中实际上没有任何作用。这意味着,要使代码与Pandas 1.5+兼容,只需删除skipna=False即可。
代码示例:
import pandas as pd
import numpy as np
# 创建包含缺失值的DataFrame
df = pd.DataFrame({'a': [1, 2, 3, np.nan, 5, 6, 7]})
# 使用rolling().mean()计算滚动均值,不带skipna参数
rolling_mean = df['a'].rolling(3).mean()
print(rolling_mean)
# 输出结果与旧版本使用skipna=False时相同原因分析:
为了验证skipna参数在Pandas 1.2.3中的行为,我们进行了以下分析:
测试程序: 创建包含缺失值的Series,并分别使用skipna=True和skipna=False计算滚动均值。结果表明,两种情况下输出相同,说明skipna参数没有生效。
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': [1, 2, 3, np.nan, 5, 6, 7]})
print(df['a'].rolling(3).mean(skipna=True))
print(df['a'].rolling(3).mean(skipna=False))输出:
0 NaN 1 NaN 2 2.0 3 NaN 4 NaN 5 NaN 6 6.0 Name: a, dtype: float64 0 NaN 1 NaN 2 2.0 3 NaN 4 NaN 5 NaN 6 6.0 Name: a, dtype: float64
官方文档: 查阅Pandas 1.2的官方文档,特别是pandas.core.window.rolling.Rolling.mean()的文档,发现该方法并没有skipna参数的说明。虽然存在**kwargs参数,但文档中对其的描述为"under review",表明该参数的功能尚未明确。
源码分析: 通过调试器,跟踪df.rolling(3).mean()的调用链,最终定位到计算滚动均值的底层C代码roll_mean()。该代码没有实现任何跳过NA值的功能,并且skipna参数在传递过程中被忽略。
BaseWindow._apply()函数接收了kwargs参数,但并未将其传递给roll_mean()。 此外,roll_mean()函数本身也没有处理缺失值的功能。
在Pandas 1.2.3中,df.rolling(n).mean(skipna=False)中的skipna参数实际上不起作用。升级到Pandas 1.5+后,只需删除该参数即可避免FutureWarning,并保持与旧版本相同的行为。如果您的代码依赖于skipna=True,则可能需要重新评估您的逻辑,因为旧版本的行为可能与您的预期不符。
以上就是Pandas滚动窗口均值中的skipna参数:兼容性与行为分析的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号