
本文旨在解决 Pandas 早期版本(如 1.2.3)中使用 df.rolling(n).mean(skipna=False) 时,在 Pandas 1.5+ 版本中出现的 FutureWarning 警告问题。通过分析旧版本的 Pandas 源码和文档,我们发现 skipna 参数实际上并未生效。因此,解决此警告的最佳方法是移除该参数。
在使用 Pandas 进行数据分析时,滚动窗口计算是一种常见的操作。rolling().mean() 方法用于计算滚动窗口的均值。在较早版本的 Pandas 中,用户可能会尝试使用 skipna 参数来控制是否跳过缺失值(NaN)。然而,在 Pandas 1.5+ 版本中,向 Rolling.mean() 传递额外的关键字参数(kwargs)会导致弃用警告,提示这些参数对结果没有影响,并且未来版本将引发 TypeError。
由于 skipna 参数在 Pandas 1.2.3 中实际上并未生效,因此最简单的解决方案是从代码中删除 skipna=False。例如,将以下代码:
df.rolling(n).mean(skipna=False)
修改为:
df.rolling(n).mean()
这样做既可以消除警告,又不会改变代码的实际行为,因为即使存在 skipna=False,缺失值也不会被跳过。
为了验证 skipna 参数在 Pandas 1.2.3 中的行为,我们可以进行以下分析:
实验验证:
运行以下代码,观察输出结果:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': [1, 2, 3, np.nan, 5, 6, 7]})
print(df['a'].rolling(3).mean(skipna=True))
print(df['a'].rolling(3).mean(skipna=False))如果 skipna 参数生效,那么 skipna=True 的结果应该与 skipna=False 的结果不同。然而,在 Pandas 1.2.3 中,你会发现它们的输出完全相同,都显示包含 NaN 的窗口均值为 NaN。
文档查阅:
查阅 Pandas 1.2.3 版本的官方文档,特别是 pandas.core.window.rolling.Rolling.mean() 的文档。你会发现该文档中并没有 skipna 参数的描述。这表明该参数可能未被正式支持或实现。
源码分析:
通过阅读 Pandas 1.2.3 的源码,特别是 pandas/core/window/rolling.py 和 pandas/_libs/window/aggregations.pyx 文件,可以确认 roll_mean() 函数的实现中没有处理缺失值的逻辑。skipna 参数虽然被传递,但并未被实际使用。
在 Pandas 1.2.3 中,df.rolling(n).mean(skipna=False) 中的 skipna 参数实际上不起作用。为了与更高版本的 Pandas 兼容,并消除弃用警告,建议直接删除该参数。如果你的代码依赖于跳过缺失值的行为,你可能需要考虑使用其他方法来实现,例如先使用 fillna() 方法填充缺失值,然后再计算滚动均值。
注意事项:
以上就是Pandas滚动窗口均值中的skipna参数:历史遗留问题与解决方案的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号