有一张表,500w条记录,4个字段如下:
id int primary key ip int class_a varchar class_b varchar
需要执行的查询语句结果是:
SELECT class_a,class_b,count(DISTINCT ip) FROM table GROUP BY class_a, class_b
目前按照上述语句执行,性能几乎为零。 求大神给点优化意见。
ip, class_a, class_b 都加过索引了。
云点滴客户解决方案是针对中小企业量身制定的具有简单易用、功能强大、永久免费使用、终身升级维护的智能化客户解决方案。依托功能强大、安全稳定的阿里云平 台,性价比高、扩展性好、安全性高、稳定性好。高内聚低耦合的模块化设计,使得每个模块最大限度的满足需求,相关模块的组合能满足用户的一系列要求。简单 易用的云备份使得用户随时随地简单、安全、可靠的备份客户信息。功能强大的报表统计使得用户大数据分析变的简单,
0
有一张表,500w条记录,4个字段如下:
id int primary key ip int class_a varchar class_b varchar
需要执行的查询语句结果是:
SELECT class_a,class_b,count(DISTINCT ip) FROM table GROUP BY class_a, class_b
目前按照上述语句执行,性能几乎为零。 求大神给点优化意见。
ip, class_a, class_b 都加过索引了。
u could add commonly index ,eg: "alert table dbname.table add index (classa, classb)", and you can use explain to synatx.
针对你的sql, 按我的理解, 建复合索引(classa, classb, ip), explain应该可以看到Using index for group-by, 这样就可以走 覆盖索引. 否则... 还不如直接Using temporary; Using filesort
500w条算比较大了,如果你想要提升速度上去,你估计要用索引覆盖可能会提升点速度。也可以考虑下分表。
把class_a和class_b作为维度再创建两个表
class_a_id, class_a_content class_b_id, class_b_content
原来500w数据的那个表中只保存class_a_id和class_b_id, 最后连表查询就像你上面那样就可以了
看一下执行计划,你对所有行内容统计,索引估计不能起效,索引读取的时候是有序的,比较1,2,3,4,他会先读1再读2再读3. 4。。。,但是全表扫描的话可以按数据块进行,所以有可能索引是不需要
可以尝试组合索引,create index indextable ON table (class_a,class_b,id)
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号