
简而言之,RANK() 会产生跳跃的排名,而 DENSE_RANK() 则不会。如果你需要考虑并列排名,并且不希望排名出现空隙,那么 DENSE_RANK() 更适合。

RANK() vs DENSE_RANK():窗口函数对比

SQL 中的 RANK() 和 DENSE_RANK() 都是窗口函数,用于为结果集中的每一行分配一个排名。它们的主要区别在于如何处理并列排名(即相同值的行)。

排名方式的差异
RANK() 函数会根据指定的排序规则,为每一行分配一个排名。如果存在并列排名,RANK() 会跳过后续的排名。例如,如果有两行排名为 2,那么下一行的排名将是 4,而不是 3。
DENSE_RANK() 函数也会为每一行分配一个排名,但它不会跳过后续的排名。如果存在并列排名,DENSE_RANK() 会为并列的行分配相同的排名,然后继续分配后续的排名,不会出现空隙。例如,如果有两行排名为 2,那么下一行的排名将是 3。
语法结构
两者的语法结构基本相同:
RANK() OVER (ORDER BY column_name [ASC | DESC]) DENSE_RANK() OVER (ORDER BY column_name [ASC | DESC])
OVER 子句指定了窗口函数的行为。ORDER BY 子句定义了排序的规则,排名会根据这个规则来确定。ASC 表示升序,DESC 表示降序。
实际应用场景
假设有一个销售额表 sales,包含 product_id(产品ID) 和 revenue(销售额) 两列。现在需要根据销售额对产品进行排名。
使用 RANK() 的 SQL 语句如下:
SELECT
product_id,
revenue,
RANK() OVER (ORDER BY revenue DESC) AS rank
FROM
sales;如果存在多个产品的销售额相同,RANK() 会跳过后续的排名。例如,销售额最高的两个产品排名都是 1,那么下一个产品的排名将会是 3。
使用 DENSE_RANK() 的 SQL 语句如下:
SELECT
product_id,
revenue,
DENSE_RANK() OVER (ORDER BY revenue DESC) AS dense_rank
FROM
sales;在这种情况下,即使存在多个产品的销售额相同,DENSE_RANK() 也会连续分配排名。销售额最高的两个产品排名都是 1,那么下一个产品的排名将会是 2。
如何选择 RANK() 还是 DENSE_RANK()
选择哪个函数取决于你的具体需求。
如果需要显示排名之间的差距,并且希望突出显示并列排名的影响,那么
RANK()更适合。例如,在比赛中,如果有多个人并列第一名,那么下一个人的排名将会是 3,这可以清楚地反映出并列排名对整体排名的影响。如果需要连续的排名,并且不希望出现空隙,那么
DENSE_RANK()更适合。例如,在奖学金评定中,即使有多个人并列第一名,下一个人的排名仍然应该是 2,而不是 3。
性能考量
在处理大数据集时,窗口函数的性能可能会受到影响。RANK() 和 DENSE_RANK() 的性能差异通常不大,但具体的性能表现取决于数据库的实现和数据的分布。为了优化性能,可以考虑以下几点:
- 确保
ORDER BY子句中的列有索引。 - 避免在窗口函数中使用复杂的表达式。
- 根据实际情况选择合适的窗口大小。
与其他窗口函数的比较
除了 RANK() 和 DENSE_RANK(),SQL 还提供了其他窗口函数,例如 ROW_NUMBER()、NTILE() 等。
-
ROW_NUMBER()函数为结果集中的每一行分配一个唯一的序号,即使存在并列排名,也不会跳过后续的序号。 -
NTILE(n)函数将结果集分成 n 个桶,并为每个桶分配一个序号。
这些窗口函数可以根据不同的需求,灵活地用于数据分析和报表生成。选择哪个函数取决于你的具体需求和数据的特点。
RANK() 和 DENSE_RANK() 在实际业务中的应用示例
在电商平台中,可以使用 RANK() 或 DENSE_RANK() 来对商品进行排名,例如根据销量、评分或浏览量。
在金融领域,可以使用 RANK() 或 DENSE_RANK() 来对股票进行排名,例如根据涨幅、成交量或市值。
在教育领域,可以使用 RANK() 或 DENSE_RANK() 来对学生进行排名,例如根据考试成绩、综合素质或论文质量。
通过灵活运用这些窗口函数,可以更好地理解数据,发现潜在的规律,并为业务决策提供支持。










