时间序列透视表需先将时间列转为datetime类型,再用pd.Grouper按频率(如'M'、'Q')分组或dt访问器提取年/季等字段,最后用pivot_table聚合;缺失周期需resample或date_range补全。

时间序列透视表在Pandas中不是独立功能,而是通过pd.pivot_table()结合时间列(如日期)的预处理(如dt.year、dt.month、pd.Grouper)实现的。关键在于把时间维度“结构化”为可分组的类别或规则频率,再按需聚合。
用pd.Grouper按时间频率自动分组
这是最简洁、最推荐的方式,尤其适合原始数据含DatetimeIndex或已转为datetime类型的列。
- 先确保时间列为
datetime类型:df['date'] = pd.to_datetime(df['date']) - 设为索引后使用
pd.Grouper:df.set_index('date').pivot_table(values='sales', index=pd.Grouper(freq='M'), columns='region', aggfunc='sum')——按月汇总各地区销售额 - 支持常用频率:
'D'(日)、'W'(周)、'M'(月末)、'MS'(月初)、'Q'(季度)、'A'(年度)
用dt访问器提取年/月/日等离散字段
适合需要组合多个时间层级(如“2023年华东Q1”),或时间列不便设索引时。
- 添加新列:
df['year'] = df['date'].dt.year,df['quarter'] = df['date'].dt.quarter - 直接用于
pivot_table:pd.pivot_table(df, values='revenue', index='year', columns=['region', 'quarter'], aggfunc='mean') - 注意:
dt.quarter返回1–4整数,可配合map转为'Q1'/'Q2'等标签提升可读性
处理非规则时间点与缺失周期
原始数据可能跳过某些日期(如节假日无记录),默认透视表不会补全空周期,需手动对齐。
立即学习“Python免费学习笔记(深入)”;
- 用
resample()先重采样再聚合(适用于时间索引):df.set_index('date').resample('MS').sum().reset_index(),再做透视 - 或用
pd.date_range()生成完整时间序列,reindex()补零:full_idx = pd.date_range(start='2023-01-01', end='2023-12-31', freq='MS'),再groupby后reindex(full_idx, fill_value=0) - 透视表本身不插值,补全逻辑应在
pivot_table调用前完成
多级时间索引与动态列名
当需同时观察年份和月份、或按工作日/周末分类时,可构建复合时间维度。
- 新增列组合:
df['year_month'] = df['date'].dt.to_period('M')(生成Period类型,天然支持排序和对齐) - 或用
cut()划分时间区间:df['period'] = pd.cut(df['date'].astype('int64'), bins=[start_ts, mid_ts, end_ts], labels=['H1', 'H2']) - 列名可动态生成:
columns=pd.Grouper(key='date', freq='2W'),让每两周自动成一列










