Sys库里的数据来源
Sys库所有的数据源来自:performance_schema。目标是把performance_schema的把复杂度降低,让DBA能更好的阅读这个库里的内容。让DBA更快的了解DB的运行情况。
Sys库下有两种表
字母开头: 适合人阅读,显示是格式化的数
x$开头 : 适合工具采集数据,原始类数据
每类表大概介绍
sys_开头是库里的配置表:
sys_config用于sys schema库的配置
视图:
host : 以IP分组相关的统计信息
innodb : innodb buffer 相关信息
io : 数据内不同维度展的IO相关的信息
memory : 以IP,连接,用户,分配的类型分组及总的占用显示内存的使用
metrics : DB的内部的统计值
processlist : 线程相关的信息(包含内部线程及用户连接)
ps_ : 没有工具统计的一些变量(没看出来存在的价值)
schema : 表结构相关的信息,例如: 自增,索引, 表里的每个字段类型,等待的锁等等
session : 用户连接相关的信息
statement : 基于语句的统计信息(重店)
statements_ : 出错的语句,进行全表扫描, 运行时间超长,排序相等(重点)
user_ : 和host_开头的相似,只是以用户分组统计
wait : 等待事件,比较专业,难看懂。
waits : 以IP,用户分组统计出来的一些延迟事件,有一定的参考价值。
Sys库能做什么,那么我们先来看看以下的问题,对于数据库,你有没有以下的疑问?
1. 谁使用了最多的资源? 基于IP或是用户?
2. 大部分连接来自哪里及发送的SQL情况?
3. 机器执行多的SQL语句是什么样?
4. 哪个文件产生了最多的IO,它的IO模式是怎么样的?
5. 那个表的IO最多?
6. 哪张表被访问过最多?
7. 哪些语句延迟比较严重?
8. 哪些SQL语句使用了磁盘临时表
9. 哪张表占用了最多的buffer pool
10. 每个库占用多少Buffer pool
11. 每个连接分配多少内存?
12. MySQL内部现在有多个线程在运行?
要解答上面的这些问题,我们首先需要学习一点基础知识,现在一块看下一些重要的视图结构:
host_summary
字段名
|
意义
|
host
|
从哪个服务器上连过来。如果是NULL,表示内部的进程
|
Statements
|
这台服务器共执行了多少语句(从启动开始统计?)
|
Statement_latency
|
这台服务器发来等待语句执行的时间
|
Statement_avg_latency
|
该服务器等待语句执行的平均时间
|
Table_scans
|
该服务器扫描表的次数(非全表)
|
File_io
|
该服务器IO事件请求的次数
|
File_io_latency
|
该服务器请求等待IO的时间
|
Current_connections
|
该服务器当前的连接数
|
Total_connections
|
该服务器总连接DB共连接多少次
|
Unique_user
|
该服务器上有几个不同用户名的账户连接过来
|
Current_memory
|
该服务器上当前连接等占用的内存
|
Total_memory_allocated
|
该服务器上的请求总共使用的内存
|
Io_global_by_file_by_bytes
字段名
|
意义
|
File
|
被操作的文件名
|
Count_read
|
总共有多少次读
|
Total_read
|
总共读了多少字节
|
Avg_read
|
平均每次读多少字节
|
Count_write
|
总共多少次写
|
Total_written
|
总共写了多少字节
|
Avg_write
|
平均每次写的字节大学
|
Total
|
读和写总共的IO大学
|
Write_pct
|
写占total里的百分比
|
User_summary
字段名
|
意义
|
User
|
客户端连接过来的用户名。如果是NULL,表示内部进程
|
Statements
|
该用户执行了多少SQL
|
Statement_latency
|
该用户执行SQL的总延迟时间
|
Statement_avg_latency
|
该用户执行SQL的平均延迟时间
|
Table_scans
|
该用户执行SQL时扫描表的次数
|
File_ios
|
该用户请求操作用掉的IO
|
File_io_latency
|
该用户请求操作的IO总延迟时间
|
Current_connections
|
该用户当前的连接数
|
Total_connections
|
该用户总的连接数
|
Unique_hosts
|
该用户从几个唯一的机器连接过来
|
Current_memory
|
该用户当前占用的内存
|
Total_memory_allocated
|
该用户总共申请到的内存(累加值)
|
Memory_global_total
Total_allocated server总共分配出去的内存(应该是server层)
Memory_by_thread_by_current_bytes
字段名
|
意义
|
Thread_id
|
内部线程ID可以和session中的thd_id关联
|
User
|
这个线程是哪个用户创建的
|
Current_count_used
|
当前使用的内存块还没有释放
|
Current_allocated
|
当前分配的内存大小(字节)而且没有被释放出来
|
Current_avg_alloc
|
平均分配的blocks
|
Current_max_alloc
|
当前线程分配的最多内存
|
Total_allocated
|
当前连总共分配的内存大小
|
Statement_analysis
字段名
|
意义
|
Query
|
归一化的SQL样子
|
Db
|
在哪个DB中执行。NULL表示在任何DB
|
Full_scan
|
全表扫描的次数
|
Exec_count
|
该SQL执行的总次数
|
Err_count
|
发生错误的次数
|
Warn_count
|
发生警告的次数
|
Total_latency
|
总共发生延迟的实际
|
Max_latency
|
最大延迟时间
|
Avg_latency
|
平均延迟时间
|
Lock_latency
|
因锁等待占用的总时间
|
Rows_sent
|
执行该SQL返回的总行数
|
Rows_sent_avg
|
执行该SQL平均返回的行数
|
Tmp_tables
|
该SQL形成内存临时表的总次数
|
Tmp_disk_tables
|
该SQL形成文件临时表的总次数
|
Rows_sorted
|
该SQL总共排序的行数
|
Sort_merge_passes
|
用于排序中合并的总次数
|
Digest
|
该语句的hash值
|
First_screen
|
该SQL最早出现的时间
|
Last_screen
|
该SQL最近出现的时间
|
Processlist && session
字段名
|
意义
|
Thd_id
|
内部线程ID
|
Conn_id
|
连接的ID,对应show processlist中的ID列
|
User
|
该线程创建的用户名
|
Db
|
连接的DB,如果NULL表示后台线程
|
Command
|
Client发起命令的类型提示
|
State
|
命令的状态
|
Time
|
基于上面的state停留的实际
|
Current_statement
|
该线程执行的语句
|
Statement_latency
|
语句运行总共占用时间
|
Progress
|
该语句运行完成的百分比
|
Lock_latency
|
该语句用于锁等待的时间
|
Rows_examined
|
该语句扫描的次数
|
Rows_send
|
该语句返回的行数
|
Rows_affected
|
该语句影响到的行数(写入语句)
|
Tmp_tables
|
形成内存临时表的次数
|
Tmp_disk_tables
|
形成磁盘临时表的次数
|
Full_scan
|
全表扫描的次数
|
…
|
|
Trx_state
|
当前事务的状态
|
Pid
|
对应到系统里的pid
|
Program_name
|
连接进来的标识名
|
Session和processlist视图基本一样,只是把后台线程过滤掉。
Innodb_buffer_stats_by_schema
字段名
|
意义
|
Object_schema
|
库名
|
Allocated
|
基于库分配的buffer pool大小
|
Data
|
基于schema实际缓存的数据大小
|
Pages
|
当前schema缓存的page数
|
Pages_hashed
|
Buffer pool中进行hash 索引的page
|
Pages_old
|
Buffer pool中的旧页,可能被置换出去
|
Rows_cached
|
Buffer pool中以行为单位的缓存
|
Innodb_buffer_stats_by_table
和innodb_buffer_stats_by_schema基本一致。只是比上面多了个object_name指定表名。
1. 谁使用了最多的资源? 基于IP或是用户?
对于该问题可以从host, user, io三个方面去了解,大概谁的请求最多。对于使用资源问题可以直接从下面四个视图里有一个大概的了解。
Select*from host_summary limit 1\G
Select*from io_global_by_file_by_bytes limit 1\G
Select*from user_summary limit 1\G
Select*from memory_global_total;
注意内存部分,不包括innodbbuffer pool。只是server 层申请的内存
2. 大部分连接来自哪里及发送的SQL情况
查看当前连接情况:
select host, current_connections,statements from host_summary;
查看当前正在执行的SQL:
select conn_id, user, current_statement, last_statement from session;
3. 机器执行最多的SQL语句是什么样?
例如查一下系统里执行最多的TOP 10 SQL。
SQL如下:
select * from statement_analysis order byexec_count desc limit 10\G;
4. 哪张表的IO最多?哪张表访问次数最多
select * from io_global_by_file_by_byteslimit 10;(参见上面表格说明)
哪张表访问次数最多,可以参考上面先查询执行最多的语句,然后查找对应的表。
SQL如下:
select * from statement_analysis order byexec_count desc limit 10\G;
5. 哪些语句延迟比较严重
statement_analysis中avg_latency的最高的。(参考上面写法)
SQL语句:
select * from statement_analysis order byavg_latency desc limit 10;
6. 哪些SQL语句使用了磁盘临时表
利用statement_analysis 中tmp_tables ,tmp_disk_tables 进行计算。(参考上面写法)
参考SQL:
select db, query, tmp_tables,tmp_disk_tables from statement_analysiswhere tmp_tables>0 or tmp_disk_tables >0 order by(tmp_tables+tmp_disk_tables) desc limit 20;
7. 哪张表占用了最多的buffer pool
例如查询在buffer pool中占用前10的表。
SQL如下:
select * from innodb_buffer_stats_by_tableorder by pages desc limit 10;
8. 每个库占用多少buffer pool
SQL如下:
select * frominnodb_buffer_stats_by_schema;
9. 每个连接分配多少内存
利用session表和memory_by_thread_by_current_bytes分配表进行关联查询。
SQL如下:
select b.user, current_count_used,current_allocated, current_avg_alloc, current_max_alloc,total_allocated,current_statement from memory_by_thread_by_current_bytes a,session b where a.thread_id = b.thd_id;
10. MySQL内部现在有多个线程在运行
MySQL内部的线程类型及数量:
select user, count(*) from processlistgroup by user;
|