0

0

SQL GROUP BY 的性能瓶颈

冰川箭仙

冰川箭仙

发布时间:2026-01-24 17:36:54

|

857人浏览过

|

来源于php中文网

原创

GROUP BY变慢主因是隐式排序、临时表和全字段扫描;有效索引需满足最左前缀+覆盖+顺序匹配;高基数分组宜用物化视图或窗口函数替代。

sql group by 的性能瓶颈

GROUP BY 为什么会变慢

根本原因不是 GROUP BY 本身,而是它触发的隐式排序、临时表和全字段扫描。MySQL 5.7 默认对 GROUP BY 强制排序(ORDER BY 同字段),即使你加了 ORDER BY NULL,优化器仍可能因缺少索引而回表或使用磁盘临时表。PostgreSQL 则更依赖哈希聚合,但若内存不足(work_mem 过小),会退化为外排,I/O 暴涨。

哪些索引能真正加速 GROUP BY

有效索引必须满足「最左前缀 + 覆盖 + 顺序匹配」:索引字段顺序要和 GROUP BY 列一致,且最好包含后续 SELECT 中的非聚合列(避免回表)。例如:

SELECT user_id, COUNT(*) FROM orders GROUP BY user_id;

INDEX(user_id) 就够;但如果写成:

SELECT user_id, status, COUNT(*) FROM orders GROUP BY user_id, status;

就必须是 INDEX(user_id, status),反过来无效。另外,status 是枚举值时,加在索引末尾还能顺便支持 WHERE status = 'paid' 条件下推。

koly.club
koly.club

一站式社群管理工具

下载

聚合函数引发的隐式性能陷阱

COUNT(*)COUNT(1) 在 InnoDB 下基本无差别,但 COUNT(column) 会过滤 NULL,导致无法走索引覆盖(除非该列定义为 NOT NULL)。更危险的是 GROUP_CONCAT()JSON_AGG():它们默认受限于 group_concat_max_len 或内存分配策略,超长时会截断或触发临时文件写入。常见错误现象包括:

  • 查询突然卡住几秒,SHOW PROCESSLIST 显示 Copying to tmp table on disk
  • EXPLAINExtra 字段出现 Using temporary; Using filesort
  • PostgreSQL 的 EXPLAIN ANALYZE 显示 HashAgg 后跟大量 External sort

替代方案比优化 GROUP BY 更有效

当分组维度高基数(如按毫秒时间戳分组)或结果集极大时,硬优化索引收益有限。此时应考虑:

  • 提前物化:用 MATERIALIZED VIEW(PostgreSQL)或汇总表(MySQL)每日/每小时预计算
  • 改用窗口函数:如需每个分组内取最新一条,ROW_NUMBER() OVER (PARTITION BY x ORDER BY y DESC) 常比 GROUP BY + JOIN 快得多
  • 下推到应用层聚合:对实时性要求不高的报表,用 ClickHouse 或 Druid 替代 OLTP 数据库做分组

最容易被忽略的一点:GROUP BY 的性能拐点往往不在数据量,而在分组后结果集大小——哪怕原表只有 10 万行,若分出 50 万组,内存就扛不住。先 SELECT COUNT(DISTINCT ...) 看分组粒度,比盲目建索引管用。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

686

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

324

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1117

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

359

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

717

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

577

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

419

2024.04.29

c++空格相关教程合集
c++空格相关教程合集

本专题整合了c++空格相关教程,阅读专题下面的文章了解更多详细内容。

0

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.9万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 808人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号