mysql千万级数据查询

php中文网
发布: 2016-06-07 15:46:53
原创
3870人浏览过

1. mysql 的数据查询 , 大小字段要分开 , 这个还是有必要的 , 除非一点就是你查询的都是索引内容而不是表内容 , 比如只查询 id 等等 2. 查询速度和索引有很大关系也就是索引的大小直接影响你的查询效果 , 但是查询条件一定要建立索引 , 这点上注意的是索引字

1.mysql的数据查询,大小字段要分开,这个还是有必要的,除非一点就是你查询的都是索引内容而不是表内容,比如只查询id等等
2.
查询速度和索引有很大关系也就是索引的大小直接影响你的查询效果,但是查询条件一定要建立索引,这点上注意的是索引字段不能太多,太多索引文件就会很大那样搜索只能变慢,
3.
查询指定的记录最好通过Id进行in查询来获得真实的数据.其实不是最好而是必须,也就是你应该先查询出复合的ID列表,通过in查询来获得数据

我们做个测试

Sql代码  mysql千万级数据查询

  1. CREATE TABLE `ipdatas` (  
  2.    `id` INT(11) NOT NULL AUTO_INCREMENT,  
  3.    `uid` INT(8) NOT NULL DEFAULT '0',  
  4.    `ipaddress` VARCHAR(50) NOT NULL,  
  5.    `source` VARCHAR(255) DEFAULT NULL,  
  6.    `track` VARCHAR(255) DEFAULT NULL,  
  7.    `entrance` VARCHAR(255) DEFAULT NULL,  
  8.    `createdtime` DATETIME NOT NULL DEFAULT '0000-00-00 00:00:00',  
  9.    `createddate` DATE NOT NULL DEFAULT '0000-00-00',  
  10.    PRIMARY KEY (`id`),  
  11.    KEY `uid` (`uid`)  
  12. ) ENGINE=MYISAM AUTO_INCREMENT=67086110 DEFAULT CHARSET=utf8;  

 里面有七百万数据。

1.全表搜索
返回结构是67015297条数据
   SELECT COUNT(id) FROM ipdatas;
   SELECT COUNT(uid) FROM ipdatas;
   SELECT COUNT(*) FROM ipdatas;
  
首先这两个全表数据查询速度很快,mysql中包含数据字典应该保留了数据库中的最大条数    SELECT COUNT(*) FROM ipdatas WHERE uid=1;   返回结果时间:231594
   SELECT COUNT(id) FROM ipdatas WHERE uid=1;
返回结果时间:129
609
   SELECT COUNT(uid) FROM ipdatas WHERE uid=1;
返回结果时间:241
813
  
第二次查询都比较快因为mysql中是有缓存区的所以增大缓存区的大小可以解决很多查询的优化,真可谓缓存无处不在啊在程序开发中也是层层都是缓存    第一条开始查询

   SELECT * FROM ipdatas ORDER BY id DESC LIMIT 1,10 ; 31
毫秒
   SELECT * FROM ipdatas LIMIT 1,10 ; 15ms   
10000条开始查询
   SELECT * FROM ipdatas ORDER BY id ASC LIMIT 10000,10 ; 266
毫秒
   SELECT * FROM ipdatas LIMIT 10000,10 ; 16
毫秒

   500万条开始查询
   SELECT * FROM ipdatas LIMIT 5000000,10 ;11.312

   SELECT * FROM ipdatas ORDER BY id ASC LIMIT 5000000,10 ; 221.985

  
这两条返回结果完全一样,也就是mysql默认机制就是id正序然而时间却大相径庭

DESTOON B2B网站管理系统
DESTOON B2B网站管理系统

DESTOON B2B网站管理系统是一套完善的B2B(电子商务)行业门户解决方案。系统基于PHP+MySQL开发,采用B/S架构,模板与程序分离,源码开放。模型化的开发思路,可扩展或删除任何功能;创新的缓存技术与数据库设计,可负载千万级别数据容量及访问。

DESTOON B2B网站管理系统 0
查看详情 DESTOON B2B网站管理系统

   5000万条开始查询
   SELECT * FROM ipdatas LIMIT 60000000,10 ;66.563
(对比下面的测试)
   SELECT * FROM ipdatas ORDER BY id ASC LIMIT 50000000,10; 1060.000

   SELECT * FROM ipdatas ORDER BY id DESC LIMIT 17015307,10; 434.937

  
第三条和第二条结果一样只是排序的方式不同但是用时却相差不少,看来这点还是不如很多的商业数据库,oraclesqlserver等都是中间不成两边还是没问题,看来mysql是开始行越向后越慢,这里看来可以不排序的就不要排序了性能差距巨大,相差了20多倍

查询数据返回ID列表    select id from ipdatas order by id asc limit 1,10; 31ms
   SELECT id FROM ipdatas LIMIT 1,10 ; 0ms   
10000条开始

   SELECT id FROM ipdatas ORDER BY id ASC LIMIT 10000,10; 68ms
   select id from ipdatas limit 10000,10;0ms

   500万条开始查询
   SELECT id FROM ipdatas LIMIT 5000000,10; 1.750s
   SELECT id FROM ipdatas ORDER BY id ASC LIMIT 5000000,10;14.328s

   6000万条记录开始查询
   SELECT id FROM ipdatas LIMIT 60000000,10; 116.406s
   SELECT id FROM ipdatas ORDER BY id ASC LIMIT 60000000,10; 136.391s

   select id from ipdatas limit 10000002,10; 29.032s
   select id from ipdatas limit 20000002,10; 24.594s
   select id from ipdatas limit 30000002,10; 24.812s
   select id from ipdatas limit 40000002,10; 28.750s 84.719s
   select id from ipdatas limit 50000002,10; 30.797s 108.042s
   select id from ipdatas limit 60000002,10; 133.012s 122.328s

   select * from ipdatas limit 10000002,10; 27.328s
   select * from ipdatas limit 20000002,10; 15.188s
   select * from ipdatas limit 30000002,10; 45.218s
   select * from ipdatas limit 40000002,10; 49.250s   50.531s
   select * from ipdatas limit 50000002,10; 73.297s   56.781s
   select * from ipdatas limit 60000002,10; 67.891s   75.141s

   select id from ipdatas order by id asc limit 10000002,10; 29.438s
   select id from ipdatas order by id asc limit 20000002,10; 24.719s
   select id from ipdatas order by id asc limit 30000002,10; 25.969s
   select id from ipdatas order by id asc limit 40000002,10; 29.860d
   select id from ipdatas order by id asc limit 50000002,10; 32.844s
   select id from ipdatas order by id asc limit 60000002,10; 34.047s

   至于SELECT * ipdatas order by id asc 就不测试了大概都在十几分钟左右
  
可见通过SELECT id 不带排序的情况下差距不太大,加了排序差距巨大    SELECT * FROM ipdatas WHERE id IN (10000,100000,500000,1000000,5000000,10000000,2000000,30000000,40000000,50000000,60000000,67015297);
  
耗时
0.094ms
  
可见inid上面的查询可以忽略不计毕竟是6000多万条记录,所以为什么很多lucenesolr搜索都返回id进行数据库重新获得数据就是因为这个,当然lucene/solr+mysql是一个不错的解决办法这个非常适合前端搜索技术,比如前端的分页搜索通过这个可以得到非常好的性能.还可以支持很好的分组搜索结果集,然后通过id获得数据记录的真实数据来显示效果真的不错

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号