SQL时间序列统计需解决时间粒度对齐、空值填充、窗口函数边界和业务口径一致性四大问题:用DATE()、YEARWEEK()、DATE_FORMAT()对齐粒度;用递归CTE生成连续日期补断点。

SQL时间序列统计的核心在于按时间分组 + 累计/滑动/同比环比计算,不是简单写个 GROUP BY 就完事。关键是要理解时间粒度对齐、空值填充、窗口函数边界和业务口径一致性——这些才是实战中卡住90%人的地方。
一、时间粒度对齐:别让“日期不干净”毁掉整个分析
原始时间字段常是 datetime 类型(含时分秒),但业务统计往往按天/周/月。直接 GROUP BY 会把同一天不同小时的数据拆开,结果错乱。
- 用 DATE() 提取日期:SELECT DATE(order_time) AS dt, COUNT(*) FROM orders GROUP BY DATE(order_time)
- 按周统计(周一为起点):SELECT YEARWEEK(order_time, 1) AS week_id, COUNT(*) FROM orders GROUP BY YEARWEEK(order_time, 1)
- 按月首日对齐(避免2月28天干扰):SELECT DATE_FORMAT(order_time, '%Y-%m-01') AS month_start, SUM(amount) FROM orders GROUP BY DATE_FORMAT(order_time, '%Y-%m-01')
二、处理断点:没有数据的日期怎么补上?
用户只在周末下单,周一到周五数据库里压根没记录。直接 GROUP BY 会漏掉5天,图表断成锯齿状——这不是数据少,是展示逻辑没闭环。
- 生成连续日期序列(MySQL 8.0+):WITH RECURSIVE dates AS (SELECT '2024-01-01' AS d UNION ALL SELECT DATE_ADD(d, INTERVAL 1 DAY) FROM dates WHERE d
- 低版本可用日历表替代:建一张包含未来5年所有日期的 calendar 表,LEFT JOIN 即可
三、滚动与累计:窗口函数不是摆设,得用对
“近7天销量”不是查7次再加总,而是用窗口函数一次算出每行对应的滚动区间;“累计用户数”也不是 SUM OVER(ORDER BY),要注意去重逻辑。
- 7日滚动求和(含当天):SUM(amount) OVER (ORDER BY DATE(create_time) ROWS BETWEEN 6 PRECEDING AND CURRENT ROW)
- 去重累计用户(按注册时间):COUNT(DISTINCT user_id) OVER (ORDER BY DATE(register_time) RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) —— 注意这里必须用 RANGE,否则同一天注册的用户可能被漏计
- 避免常见错误:不要用 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 做去重累计,它不保证逻辑正确
四、同比环比:别硬除,先对齐再算差
同比=今年某日 / 去年同日,但去年那天可能没数据;环比=本周/上周,但跨年时 WEEK() 函数会跳变。直接减或除,容易报错或结果失真。
- 安全环比(自动找上周同 weekday):LAG(SUM(sales), 1) OVER (ORDER BY week_start) —— 先按周聚合,再用 LAG 取前一行
- 同比带空值保护:ROUND(IFNULL(CUR.sales / NULLIF(LAST_YEAR.sales, 0), 0), 2) AS yoy_rate
- 更稳做法:用 LEFT JOIN 关联当前周与去年同周(DATE_SUB(week_start, INTERVAL 1 YEAR)),再计算
基本上就这些。时间序列统计不复杂,但容易忽略对齐、补全、去重和空值这四个隐形关卡。练熟这四招,90%的日报、周报、运营看板需求都能自己写 SQL 解决,不用等数仓同学排期。










