学习使用MySQL 5.7的sys库

瓜瓜2uuq7332fe 2019-03-20

展开全文

Sys库里的数据来源

Sys库所有的数据源来自：performance_schema。目标是把performance_schema的把复杂度降低，让DBA能更好的阅读这个库里的内容。让DBA更快的了解DB的运行情况。

Sys库下有两种表

字母开头：适合人阅读，显示是格式化的数

x$开头：适合工具采集数据，原始类数据

每类表大概介绍

sys_开头是库里的配置表：

sys_config用于sys schema库的配置

视图：

host : 以IP分组相关的统计信息

innodb : innodb buffer 相关信息

io : 数据内不同维度展的IO相关的信息

memory : 以IP，连接，用户，分配的类型分组及总的占用显示内存的使用

metrics : DB的内部的统计值

processlist : 线程相关的信息(包含内部线程及用户连接）

ps_ : 没有工具统计的一些变量（没看出来存在的价值）

schema : 表结构相关的信息，例如：自增，索引，表里的每个字段类型，等待的锁等等

session : 用户连接相关的信息

statement : 基于语句的统计信息（重店）

statements_ : 出错的语句，进行全表扫描，运行时间超长，排序相等（重点）

user_ : 和host_开头的相似，只是以用户分组统计

wait : 等待事件，比较专业，难看懂。

waits : 以IP，用户分组统计出来的一些延迟事件，有一定的参考价值。

Sys库能做什么，那么我们先来看看以下的问题，对于数据库，你有没有以下的疑问？

1. 谁使用了最多的资源？基于IP或是用户？

2. 大部分连接来自哪里及发送的SQL情况？

3. 机器执行多的SQL语句是什么样？

4. 哪个文件产生了最多的IO，它的IO模式是怎么样的？

5. 那个表的IO最多？

6. 哪张表被访问过最多？

7. 哪些语句延迟比较严重？

8. 哪些SQL语句使用了磁盘临时表

9. 哪张表占用了最多的buffer pool

10. 每个库占用多少Buffer pool

11. 每个连接分配多少内存？

12. MySQL内部现在有多个线程在运行？

要解答上面的这些问题，我们首先需要学习一点基础知识，现在一块看下一些重要的视图结构：

host_summary

字段名	意义
host	从哪个服务器上连过来。如果是NULL，表示内部的进程
Statements	这台服务器共执行了多少语句（从启动开始统计？）
Statement_latency	这台服务器发来等待语句执行的时间
Statement_avg_latency	该服务器等待语句执行的平均时间
Table_scans	该服务器扫描表的次数（非全表）
File_io	该服务器IO事件请求的次数
File_io_latency	该服务器请求等待IO的时间
Current_connections	该服务器当前的连接数
Total_connections	该服务器总连接DB共连接多少次
Unique_user	该服务器上有几个不同用户名的账户连接过来
Current_memory	该服务器上当前连接等占用的内存
Total_memory_allocated	该服务器上的请求总共使用的内存

Io_global_by_file_by_bytes

字段名	意义
File	被操作的文件名
Count_read	总共有多少次读
Total_read	总共读了多少字节
Avg_read	平均每次读多少字节
Count_write	总共多少次写
Total_written	总共写了多少字节
Avg_write	平均每次写的字节大学
Total	读和写总共的IO大学
Write_pct	写占total里的百分比

User_summary

字段名	意义
User	客户端连接过来的用户名。如果是NULL，表示内部进程
Statements	该用户执行了多少SQL
Statement_latency	该用户执行SQL的总延迟时间
Statement_avg_latency	该用户执行SQL的平均延迟时间
Table_scans	该用户执行SQL时扫描表的次数
File_ios	该用户请求操作用掉的IO
File_io_latency	该用户请求操作的IO总延迟时间
Current_connections	该用户当前的连接数
Total_connections	该用户总的连接数
Unique_hosts	该用户从几个唯一的机器连接过来
Current_memory	该用户当前占用的内存
Total_memory_allocated	该用户总共申请到的内存（累加值）

Memory_global_total

Total_allocated server总共分配出去的内存（应该是server层）

Memory_by_thread_by_current_bytes

字段名	意义
Thread_id	内部线程ID可以和session中的thd_id关联
User	这个线程是哪个用户创建的
Current_count_used	当前使用的内存块还没有释放
Current_allocated	当前分配的内存大小（字节）而且没有被释放出来
Current_avg_alloc	平均分配的blocks
Current_max_alloc	当前线程分配的最多内存
Total_allocated	当前连总共分配的内存大小

Statement_analysis

字段名	意义
Query	归一化的SQL样子
Db	在哪个DB中执行。NULL表示在任何DB
Full_scan	全表扫描的次数
Exec_count	该SQL执行的总次数
Err_count	发生错误的次数
Warn_count	发生警告的次数
Total_latency	总共发生延迟的实际
Max_latency	最大延迟时间
Avg_latency	平均延迟时间
Lock_latency	因锁等待占用的总时间
Rows_sent	执行该SQL返回的总行数
Rows_sent_avg	执行该SQL平均返回的行数
Tmp_tables	该SQL形成内存临时表的总次数
Tmp_disk_tables	该SQL形成文件临时表的总次数
Rows_sorted	该SQL总共排序的行数
Sort_merge_passes	用于排序中合并的总次数
Digest	该语句的hash值
First_screen	该SQL最早出现的时间
Last_screen	该SQL最近出现的时间

Processlist && session

字段名	意义
Thd_id	内部线程ID
Conn_id	连接的ID，对应show processlist中的ID列
User	该线程创建的用户名
Db	连接的DB，如果NULL表示后台线程
Command	Client发起命令的类型提示
State	命令的状态
Time	基于上面的state停留的实际
Current_statement	该线程执行的语句
Statement_latency	语句运行总共占用时间
Progress	该语句运行完成的百分比
Lock_latency	该语句用于锁等待的时间
Rows_examined	该语句扫描的次数
Rows_send	该语句返回的行数
Rows_affected	该语句影响到的行数（写入语句）
Tmp_tables	形成内存临时表的次数
Tmp_disk_tables	形成磁盘临时表的次数
Full_scan	全表扫描的次数
…
Trx_state	当前事务的状态
Pid	对应到系统里的pid
Program_name	连接进来的标识名

Session和processlist视图基本一样，只是把后台线程过滤掉。

Innodb_buffer_stats_by_schema

字段名	意义
Object_schema	库名
Allocated	基于库分配的buffer pool大小
Data	基于schema实际缓存的数据大小
Pages	当前schema缓存的page数
Pages_hashed	Buffer pool中进行hash 索引的page
Pages_old	Buffer pool中的旧页，可能被置换出去
Rows_cached	Buffer pool中以行为单位的缓存

Innodb_buffer_stats_by_table

和innodb_buffer_stats_by_schema基本一致。只是比上面多了个object_name指定表名。

1. 谁使用了最多的资源？基于IP或是用户？

对于该问题可以从host, user, io三个方面去了解，大概谁的请求最多。对于使用资源问题可以直接从下面四个视图里有一个大概的了解。

Select*from host_summary limit 1\G

Select*from io_global_by_file_by_bytes limit 1\G

Select*from user_summary limit 1\G

Select*from memory_global_total;

注意内存部分，不包括innodbbuffer pool。只是server 层申请的内存

2. 大部分连接来自哪里及发送的SQL情况

查看当前连接情况：

select host, current_connections,statements from host_summary;

查看当前正在执行的SQL：

select conn_id, user, current_statement, last_statement from session;

3. 机器执行最多的SQL语句是什么样?

例如查一下系统里执行最多的TOP 10 SQL。

SQL如下：

select * from statement_analysis order byexec_count desc limit 10\G;

4. 哪张表的IO最多？哪张表访问次数最多

select * from io_global_by_file_by_byteslimit 10;(参见上面表格说明)

哪张表访问次数最多，可以参考上面先查询执行最多的语句，然后查找对应的表。

SQL如下：

select * from statement_analysis order byexec_count desc limit 10\G;

5. 哪些语句延迟比较严重

statement_analysis中avg_latency的最高的。(参考上面写法)

SQL语句：

select * from statement_analysis order byavg_latency desc limit 10;

6. 哪些SQL语句使用了磁盘临时表

利用statement_analysis 中tmp_tables ，tmp_disk_tables 进行计算。(参考上面写法)

参考SQL：

select db, query, tmp_tables,tmp_disk_tables from statement_analysiswhere tmp_tables>0 or tmp_disk_tables >0 order by(tmp_tables+tmp_disk_tables) desc limit 20；

7. 哪张表占用了最多的buffer pool

例如查询在buffer pool中占用前10的表。

SQL如下：

select * from innodb_buffer_stats_by_tableorder by pages desc limit 10;

8. 每个库占用多少buffer pool

SQL如下：

select * frominnodb_buffer_stats_by_schema;

9. 每个连接分配多少内存

利用session表和memory_by_thread_by_current_bytes分配表进行关联查询。

SQL如下：

select b.user, current_count_used,current_allocated, current_avg_alloc, current_max_alloc,total_allocated,current_statement from memory_by_thread_by_current_bytes a,session b where a.thread_id = b.thd_id;

10. MySQL内部现在有多个线程在运行

MySQL内部的线程类型及数量：

select user, count(*) from processlistgroup by user;