窗口函数在保留原始行结构的同时进行分组计算,支持明细与聚合数据共存。其执行位于GROUP BY之后、最终ORDER BY之前,通过OVER子句定义分区(PARTITION BY)、排序(ORDER BY)和行范围(frame_clause)。核心类型包括:排名函数(ROW_NUMBER、RANK等)、分布函数(PERCENT_RANK)、前后行访问(LAG/LEAD)及聚合类窗口函数(SUM/AVG等)。典型应用如按区域累计销售额:SUM(amount) OVER (PARTITION BY region ORDER BY sale_date);结合RANK获取各区最高销售记录;使用ROWS BETWEEN 2 PRECEDING AND CURRENT ROW计算三日移动平均。窗口函数将复杂关联简化为单一表达式,显著提升查询可读性与性能,是数据分析的关键工具。

PostgreSQL窗口函数之所以功能强大,是因为它能在不破坏原有行结构的前提下,对一组相关行进行计算,同时保留每行的独立性。这使得我们可以在单条查询中同时获取明细数据和聚合结果,比如在显示每个员工薪资的同时,列出其所在部门的平均薪资、排名等信息。
窗口函数的基本原理
窗口函数的执行发生在SQL查询的最后阶段之一,在FROM、WHERE、GROUP BY、HAVING之后,但早于ORDER BY(最终排序)。这意味着窗口函数可以基于已分组或过滤后的结果集操作,但不会像GROUP BY那样将多行合并为一行。
其核心语法结构是:
function_name() OVER ( [PARTITION BY ...] [ORDER BY ...] [frame_clause] )
- PARTITION BY:将数据划分为多个“分区”,窗口函数在每个分区内独立计算,类似GROUP BY,但不压缩行数
- ORDER BY:定义窗口内行的顺序,对排名类函数(如ROW_NUMBER)至关重要
- Frame Clause:精确控制当前行周围的行范围,例如ROWS BETWEEN 2 PRECEDING AND CURRENT ROW,用于移动平均等场景
常见且实用的窗口函数类型
PostgreSQL提供多种内置窗口函数,涵盖分析、统计和排名需求:
- 排名函数:ROW_NUMBER()、RANK()、DENSE_RANK(),适用于榜单、去重等场景
- 分布函数:PERCENT_RANK()、CUME_DIST(),用于分析数据分布位置
- 前后行访问:LAG()、LEAD(),可轻松比较当前行与上一行/下一行的值
- 聚合函数作为窗口函数:SUM()、AVG()、MAX()等加上OVER子句,实现动态累计或分组统计
典型应用场景示例
假设有一个销售表sales,包含字段:region, sale_date, amount。
- 计算每个区域每日销售额的累计总和:
SUM(amount) OVER (PARTITION BY region ORDER BY sale_date) - 找出每个区域内销售额最高的记录(结合RANK):
RANK() OVER (PARTITION BY region ORDER BY amount DESC),然后筛选排名为1的行 - 计算移动平均:过去三天的平均销售额
AVG(amount) OVER (ORDER BY sale_date ROWS BETWEEN 2 PRECEDING AND CURRENT ROW)
基本上就这些。窗口函数的强大在于它把复杂的多表关联或子查询简化成一句表达式,提升可读性和执行效率,是数据分析类查询不可或缺的工具。











