专栏 | MySQL 5.7系列之sys schema(2) by吴炳锡

吴炳锡@知数堂老叶茶馆 2023-03-10

作者：吴炳锡（知数堂培训联合创始人）

0、导读

MySQL 5.7引入了sys schema，有了它，我们排查分析一些问题时将更得心应手。sys schema里主要存储的是视图、存储过程、函数等。
视图：用于结果的汇总展示及配置持久化；
存储过程：用于对Performance schema的控制及收集；
函数：对于Performance schema的配置及数据格式化。

本文约2000字，阅读时间约10分钟。

1、本文目标

上篇我们只是先简单介绍了下sys schema可以做什么，以及几个基础概念，本文继续深入介绍sys schema，回答上篇我们留下的几个问题：

哪个用户或者来自哪个IP的客户端使用了最多的资源；
数据库连接来自哪里，以及这些连接对数据库的请求情况是怎样的；
数据库中哪些SQL被频繁执行；
哪个文件产生了最多的IO，读多，还是写的多；
哪个表上的IO请求最多；
哪个表被访问的最多；
哪些语句延迟比较严重；
哪些SQL语句使用了临时表，又有哪些用到了磁盘临时表；
哪个表占用了最多的buffer pool；
每个库（database）占用多少buffer pool；
每个连接分配多少内存；
MySQL内部有多个线程在运行；
其他...

2、基本视图介绍

host_summary视图

字段名	意义
host	从哪个客户机上连过来。如果是NULL，表示内部的进程
statements	该客户机共执行了多少语句
statement_latency	该客户机发来等待语句执行的时间
statement_avg_latency	该客户机等待语句执行的平均时间
table_scans	该客户机发生全表扫描的次数
file_ios	该客户机上IO事件请求的次数
file_io_latency	该客户机请求等待IO的时间
current_connections	该客户机当前的连接数
total_connections	该客户机连接DB共有多少次
unique_user	该客户机上有几个不同用户名的帐户连接过来
current_memory	该客户机上当前连接占用的内存
total_memory_allocated	该客户机上的请求总共使用的内存量（历史累计值）

io_global_by_file_by_bytes视图

file	被操作的文件名
count_read	总共有多少次读
total_read	总共读了多少字节
avg_read	平均每次读的字节数
count_write	总共有多少次写
total_written	总共写了多少字节
avg_write	平均每次写的字节大小
total	读和写总共的IO大小
write_pct	写请求占总IO请求中的百分比（就是通常所说的读写比）

user_summary视图

user	客户端连接过来的用户名，如果是NULL，表示内部进程
statements	该用户执行了多少SQL
statement_latency	该用户执行SQL的总延迟时间
statement_avg_latency	该用户执行SQL的平均延迟时间
table_scans	该用户执行SQL时发生全表扫描的次数
file_ios	该用户发生的IO请求总量
file_io_latency	该用户发生的IO请求总延迟时间
current_connections	该用户当前的连接
total_connections	该用户总的连接数
unique_hosts	该用户从几个不同客户机连接过来
current_memory	该用户当前占用的内存
total_memory_allocated	该用户总共申请到的内存（历史累计值）

memory_global_total视图

total_allocated

Server总共分配出去的内存大小

memory_by_thread_by_current_bytes视图

thread_id	MySQL内部线程ID，可以和session视图中的thd_id关联
user	当前线程是哪个用户创建
current_count_used	当前线程正在使用且未释放的内存块（内存块不是固定大小的）
current_allocated	当前线程正在使用且未释放的内存块大小（字节）
current_avg_alloc	当前线程每个内存块平均分配内存大小（字节）
current_max_alloc	当前线程单次曾经分配的最多内存大小（字节）
total_allocated	当前线程总共分配的内存大小

statement_analysis视图

query	格式化后的SQL（将SQL中的参数替换成？）
db	在哪个DB中执行，如果为NULL表示在任何DB
full_scan	是否使用了全表扫描
exec_count	该SQL被执行的总次数
err_count	发生错误的次数
warn_count	发生警告的次数
total_latency	总共发生延迟的时间
max_latency	最大延迟的时间
avg_latency	平均延迟的时间
lock_latency	因锁等待占用的总时间
rows_sent	执行该SQL返回的总行数
rows_sent_avg	执行该SQL平均返回的行数
rows_examined	执行该SQL扫描的总行数
rows_examined_avg	执行该SQL平均每次扫描的行数
tmp_tables	该SQL生成内存临时表的总次数
tmp_disk_tables	该SQL生成磁盘文件临时表的总次数
rows_sorted	该SQL总共排序的行数
sort_merge_passes	用于排序中合并的总次数
digest	该语句的HASH值
first_seen	该SQL最早出现的时间
last_seen	该SQL最近出现的时间

processlist视图

thd_id	内部线程ID
conn_id	连接的ID（对应show processlist中的"Id"列）
user	该线程创建的用户名
db	连接的DB，如果是NULL表示后台线程
command	Client发起命令的类型提示
state	命令的状态
time	基于上面state停留的时间
current_statement	该线程执行的语句
statement_latency	语句运行总共占用时间
progress	该语句运行完成的百分比
lock_latency	该语句用于锁等待的时间
rows_examined	该语句扫描的行数
rows_send	该语句返回的行数
rows_affected	该语句影响到的行数(写入语句)
tmp_tables	形成内存临时表的次数
tmp_disk_tables	形成磁盘临时表的次数
full_scan	全表描扫的次数
last_statement	上一条被执行的SQL
last_statement_latency	上一条被执行的SQL时延
current_memory	当前线程占用的内存
last_wait	上一次等待事件
last_wait_latency	上一次等待时间时延
source	上一次等待事件对应的源码位置
trx_latency	事务时延
trx_state	当前事务状态
pid	对应到系统里的pid
program_name	连接进来的标识名

session视图

session视图和processlist视图基本一样，只是把后台线程过滤掉。

innodb_buffer_stats_by_schema视图

object_schema	schema名
allocated	该schema上分配的buffer pool大小（字节）
data	该schema中缓存的数据大小（字节）
pages	该schema中缓存的data page数
pages_hashed	该schema中分配了多少hashed page
pages_old	该schema中的old page数量
rows_cached	该schema中缓存的row data数量

innodb_buffer_stats_by_table视图

和innodb_buffer_stats_by_schema基本一致，只是比上面那个视图多了一个ojbect_name用于指定表名。

3、sys schema运用

上面把几个基础的视图都介绍完了，接下来就可以回答上篇提出的那些问题了。

哪个用户或者来自哪个IP的客户端使用了最多的资源

查看每个客户端IP过来的连接消耗了多少资源：

查看某个数据文件上发生了多少IO请求：

查看哪个用户消耗了多少资源：

查看总共分配了多少内存：

数据库连接来自哪里，以及这些连接对数据库的请求情况是怎样的

查看当前连接情况：

select host, current_connections, statements from host_summary;

查看当前正在执行的SQL：

select conn_id, user, current_statement, last_statement from session;

和执行show full processlist的效果相当。

数据库中哪些SQL被频繁执行

执行下面命令查询TOP 10最热SQL：

select db,exec_count,query from statement_analysis order by exec_count desc limit 10;

哪个文件产生了最多的IO，读多，还是写的多

select * from io_global_by_file_by_bytes limit 10;

哪个表上的IO请求最多

select * from io_global_by_file_by_bytes where file like '%ibd' order by total desc limit 10;

哪个表被访问的最多

先访问statement_analysis，根据热门SQL排序找到相应的数据表。

哪些语句延迟比较严重

查看 statement_analysis 中 avg_latency的最高的SQL：

select * from statement_analysis order by avg_latency desc limit 10;

哪些SQL语句使用了临时表，又有哪些用到了磁盘临时表

查看 statement_analysis 中哪个SQL的 tmp_tables 、tmp_disk_tables 值大于0即可：

select db, query, tmp_tables, tmp_disk_tables from statement_analysis where tmp_tables>0 or tmp_disk_tables >0 order by (tmp_tables+tmp_disk_tables) desc limit 20;

哪个表占用了最多的buffer pool

select * from innodb_buffer_stats_by_table order by allocated desc limit 10;

每个库（database）占用多少buffer pool

select * from innodb_buffer_stats_by_schema order by allocated desc limit 10;

每个连接分配多少内存

利用session表和memory_by_thread_by_current_bytes分配表进行关联查询：

select b.user, current_count_used, current_allocated, current_avg_alloc, current_max_alloc, total_allocated,current_statement from memory_by_thread_by_current_bytes a, session b where a.thread_id = b.thd_id;

MySQL内部有多个线程在运行

MySQL内部的线程类型及数量：

select user, count(*) from processlist group by user;

写到这里，其实我们只涉及到 sys schema 很少的一部分功能。估计MySQL的官方AWR也要快出现了，大家也可以期待一下（MySQL 8.0这块又进一步规范了一下）

本文要特别感谢 知数堂徐伟 同学的校验。

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

专栏 | MySQL 5.7系列之sys schema(2) by吴炳锡

0、导读

1、本文目标

2、基本视图介绍

3、sys schema运用

您可能也对以下帖子感兴趣

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

生成图片，分享到微信朋友圈

专栏 | MySQL 5.7系列之sys schema(2) by吴炳锡

0、导读

1、本文目标

2、基本视图介绍

3、sys schema运用

您可能也对以下帖子感兴趣