SQL数据库聚合算子实现_hash与sort对比

冷炫風刃

发布时间：2026-01-07 17:40:03

709人浏览过

来源于php中文网

原创

SQL聚合底层主要有Hash Aggregate和Sort-Aggregate两种策略：前者基于哈希表，适合高基数、无序输入，内存充足时高效但输出无序；后者先排序再扫描，适合低基数、已排序输入或需有序输出，内存可控且结果天然有序。

sql数据库聚合算子实现_hash与sort对比

在SQL数据库中，聚合操作（如 GROUP BY、SUM、COUNT 等）的底层实现通常依赖两种主流策略：基于哈希的聚合（Hash Aggregate）和基于排序的聚合（Sort-Aggregate）。二者核心差异在于数据组织方式与适用场景，直接影响性能、内存消耗和结果有序性。

Hash Aggregate：适合无序分组、高基数场景

哈希聚合通过构建哈希表来归集相同键值的行，对每个键维护一个聚合状态（如累加器、计数器）。它不要求输入有序，可流式处理，适合中间结果无序或无法提前排序的情况。

内存友好：若哈希表能完全放入内存，效率极高；但数据量超限时可能触发磁盘哈希（spill to disk），显著拖慢速度
不保证输出顺序：结果顺序取决于哈希桶遍历顺序，与原始数据或分组键字典序无关
适合高基数分组（如按用户ID聚合百万级用户），因哈希查找为O(1)平均复杂度
常见于PostgreSQL（HashAggregate）、SQL Server（Hash Match Aggregate）、ClickHouse（AggregatingHash）

Sort-Aggregate：适合低基数、需有序输出或已排序输入

排序聚合先按分组键排序，再顺序扫描——相同键必然相邻，只需一次遍历即可完成累加。它天然依赖排序稳定性，也常复用已存在的索引排序或上游排序算子。

先锋多用户商城系统

修改自网上仿乐购商城，新增功能：1、数据库在线备份与导入功能，可以随时备份数据库，数据受损可以导入数据库，确保数据安全；2、增加组合商品概念，可以用于组配商品销售（比如外套有蓝色和红色，鞋子有40码和41码等），买一送一、组合销售（比如上衣＋围巾＋长裙做为一个套装商品）和加价购买等销售方式；3、按照商品重量和送货距离实时计算精确运费，并可在订单中予以显示，使运费金额实现实时动态准确显示、清晰明了；

下载

内存开销更可控：排序阶段可能使用外部归并排序，但聚合阶段仅需O(1)额外空间（只存当前组状态）
输出天然有序：结果严格按分组键升序（或指定排序方向）排列，省去后续 ORDER BY
低基数分组更优：当分组键取值少（如按“省份”聚合全国订单），排序成本低，且缓存局部性好
若输入已按分组键排序（如走索引扫描），可跳过排序阶段，直接流式聚合，性能极佳

选择依据：看数据特征与执行上下文

优化器不会凭空决策，而是结合统计信息（如分组键的NDV——唯一值数量）、可用内存、输入是否有序、是否需要输出排序等综合判断。

NDV高 + 输入乱序 + 内存充足 → 倾向 Hash Aggregate
NDV低 / 输入已按 GROUP BY 键排序 / 查询含 ORDER BY GROUP BY 键 → 倾向 Sort-Aggregate
内存不足时，Hash Aggregate 可能退化为多轮磁盘哈希，而 Sort-Aggregate 的外部排序更稳定，但整体变慢
某些引擎（如MySQL 8.0+）默认优先尝试 sort-agg，除非估算哈希更优；而 Presto/Trino 默认启用 hash agg 并自动 fallback

手动干预与调优提示

虽然多数现代数据库自动选择，但在特定场景下可通过Hint或配置引导：

PostgreSQL：用 SET enable_hashagg = off 强制禁用哈希聚合
SQL Server：查询提示 OPTION (HASH GROUP) 或 OPTION (ORDER GROUP)
ClickHouse：在 GROUP BY 后加 WITH TOTALS 或调整 max_bytes_before_external_group_by 控制哈希溢出阈值
观察执行计划：认准 HashAggregate、SortAggregate、StreamingAgg（表示输入已排序）等节点名称

SQL运维数据可视化_Grafana数据库监控大盘

SQL高可用选型分析_MySQL与PostgreSQL对比

SQL数据库运维进阶_主从复制原理与延迟问题排查

SQL数据库系统架构_MySQL整体设计深度剖析

SQL运维自动化实践_Ansible批量管理数据库

相关标签:

mysql stream 排列 gate sql mysql count sort 归并排序 postgresql 数据库 clickhouse

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL数据库执行计划实战_成本模型与优化路径下一篇：SQL数据库崩溃恢复阶段_analysis与redo

作者最新文章

艾诺迪亚4地图全解锁_艾诺迪亚4全地图位置怪物掉落详解

2026-01-09 09:03

Python时间序列分析教程_Pandas时间索引实践

2026-01-09 09:08

千焦单位热量换算指南_千焦单位与大卡卡路里转换关系

2026-01-09 09:10

劳动仲裁需要本人去吗_劳动仲裁不一定本人到场可委托代理人参加

2026-01-09 09:27

无人机驾驶证报考官网入口uom

2026-01-09 09:33

SQL高可用选型分析_MySQL与PostgreSQL对比

2026-01-09 09:50

小米手机怎么开空调遥控_小米手机红外遥控空调开启方法

2026-01-09 11:11

oppo官网怎么查激活时间_OPPO序列号查询激活日期入口

2026-01-09 11:45

在哪里关闭抖音商城功能路径与教程

2026-01-09 12:09

Python大模型提示工程教程_Prompt设计技巧

2026-01-09 12:09

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

676

2023.10.12