mysql表超过千万级别记录快速查询总记录数量

新用户5605YaM3 2020-10-14

展开全文

mysql表超过百万级记录快速查询总记录数量。

我们平常想知道一张表里有多少记录，一般通过count就可以直接查询：

> select count(*) from user;

或者如下也可以：

> select count(1) from user;

但是，假设目前user表中有超过数以千万级别的记录量，我们来模拟一下这个数据量。
创建表：

CREATE TABLE user100w(
id INT NOT NULL AUTO_INCREMENT,
first_name VARCHAR(10) NOT NULL,
last_name VARCHAR(10) NOT NULL,
sex VARCHAR(5) NOT NULL,
score INT NOT NULL,
copy_id INT NOT NULL,
PRIMARY KEY (`id`)
);

然后创建存储过程：

mysql>     DELIMITER;
mysql>     create PROCEDURE add_user(in num INT)
    ->     BEGIN
    ->         DECLARE rowid INT DEFAULT 0;
    ->         DECLARE firstname CHAR(1);
    ->         DECLARE name1 CHAR(1);
    ->         DECLARE name2 CHAR(1);
    ->         DECLARE lastname VARCHAR(3) DEFAULT &#39;';
    ->         DECLARE sex CHAR(1);
    ->         DECLARE score CHAR(2);
    ->         WHILE rowid < num DO
    ->         SET firstname = SUBSTRING('赵钱孙李周吴郑王林杨柳刘孙陈江阮侯邹高彭徐',FLOOR(1+21*RAND()),1); 
    ->         SET name1 = SUBSTRING('一二三四五六七八九十甲乙丙丁静景京晶名明铭敏闵民军君俊骏天田甜兲恬益依成城诚立莉力黎励',ROUND(1+43*RAND()),1); 
    ->         SET name2 = SUBSTRING('一二三四五六七八九十甲乙丙丁静景京晶名明铭敏闵民军君俊骏天田甜兲恬益依成城诚立莉力黎励',ROUND(1+43*RAND()),1); 
    ->         SET sex=FLOOR(0 + (RAND() * 2));
    ->         SET score= FLOOR(40 + (RAND() *60));
    ->         SET rowid = rowid + 1;
    ->         IF ROUND(RAND())=0 THEN 
    ->         SET lastname =name1;
    ->         END IF;
    ->         IF ROUND(RAND())=1 THEN
    ->         SET lastname = CONCAT(name1,name2);
    ->         END IF;
    ->         insert INTO user100w (first_name,last_name,sex,score,copy_id) VALUES (firstname,lastname,sex,score,rowid);  
    ->         END WHILE;
    ->     END //

我们开始调用存储过程插入1千万条数据，可以看到耗费了1个小时15分钟17.49秒：

mysql> call add_user(10000000);
Query OK, 1 row affected (1 hour 15 min 17.49 sec)

这个数据量的时候，我们使用count直接查询可能持续需要几秒甚至更长时间，这里看到用了两秒多的时间其实已经很长了：

那么，如何缩短这个总记录量的查询时间呢？我们可以通过information_schema来做查询，首先切换到mysql库：

mysql> use mysql;

然后执行：

select table_rows from information_schema.tables where table_name = 'user100w' and table_schema = 'test&#39;;

结果我们可以很清楚的看到耗费不到一秒钟了：

但存在一个问题，我们发现：明明总记录量是10000000条，为什么查询出来是9735593条呢？少了很多啊！

我们试着来使用analyze更新表的统计数据：

mysql> analyze table test.user100w;

然后再来执行刚才的查询sql查询表的总记录量会发现还是少了很多记录，所以这种方式适用于统计表中大概的记录总数，不是精确的统计。

本文章由ECode1024原创并首发于ECode1024，严谨转载。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：新用户5605YaM3 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

新用户5605YaM3

关注对话

TA的最新馆藏

QueryBuilder构造ES查询条件精准匹配、模糊搜索、in、范围查询 and or
Elasticsearch相关组件版本对照表
Spring Boot中自定义注解+AOP实现主备库切换
Routine Load | Apache Doris
帮助管理
Spring Boot中自定义注解+AOP实现主备库切换 · 玹霖志

喜欢该文的人也喜欢更多

热门阅读换一换