查看原文
其他

专栏 | MySQL 5.7系列之sys schema(2) by吴炳锡

吴炳锡@知数堂 老叶茶馆 2023-03-10

作者:吴炳锡(知数堂培训联合创始人)

0、导读

MySQL 5.7引入了sys schema,有了它,我们排查分析一些问题时将更得心应手。sys schema里主要存储的是视图、存储过程、函数等。

视图:用于结果的汇总展示及配置持久化;

存储过程:用于对Performance schema的控制及收集;

函数:对于Performance schema的配置及数据格式化。


本文约2000字,阅读时间约10分钟。

1、本文目标

上篇我们只是先简单介绍了下sys schema可以做什么,以及几个基础概念,本文继续深入介绍sys schema,回答上篇我们留下的几个问题:

  • 哪个用户或者来自哪个IP的客户端使用了最多的资源;

  • 数据库连接来自哪里,以及这些连接对数据库的请求情况是怎样的;

  • 数据库中哪些SQL被频繁执行;

  • 哪个文件产生了最多的IO,读多,还是写的多;

  • 哪个表上的IO请求最多;

  • 哪个表被访问的最多;

  • 哪些语句延迟比较严重;

  • 哪些SQL语句使用了临时表,又有哪些用到了磁盘临时表;

  • 哪个表占用了最多的buffer pool;

  • 每个库(database)占用多少buffer pool;

  • 每个连接分配多少内存;

  • MySQL内部有多个线程在运行;

  • 其他...

2、基本视图介绍

  • host_summary视图

字段名

意义

host

从哪个客户机上连过来。如果是NULL,表示内部的进程

statements

该客户机共执行了多少语句

statement_latency

该客户机发来等待语句执行的时间

statement_avg_latency

该客户机等待语句执行的平均时间

table_scans

该客户机发生全表扫描的次数

file_ios

该客户机上IO事件请求的次数

file_io_latency

该客户机请求等待IO的时间

current_connections

该客户机当前的连接数

total_connections

该客户机连接DB共有多少次

unique_user

该客户机上有几个不同用户名的帐户连接过来

current_memory

该客户机上当前连接占用的内存

total_memory_allocated

该客户机上的请求总共使用的内存量(历史累计值)


  • io_global_by_file_by_bytes视图

file

被操作的文件名

count_read

总共有多少次读

total_read

总共读了多少字节

avg_read

平均每次读的字节数

count_write

总共有多少次写

total_written

总共写了多少字节

avg_write

平均每次写的字节大小

total

读和写总共的IO大小

write_pct

写请求占总IO请求中的百分比(就是通常所说的读写比)


  • user_summary视图

user

客户端连接过来的用户名,如果是NULL,表示内部进程

statements

用户执行了多少SQL

statement_latency

该用户执行SQL的总延迟时间

statement_avg_latency

该用户执行SQL的平均延迟时间

table_scans

该用户执行SQL时发生全表扫描的次数

file_ios

该用户发生的IO请求总量

file_io_latency

该用户发生的IO请求总延迟时间

current_connections

该用户当前的连接

total_connections

该用户总的连接数

unique_hosts

该用户从几个不同客户机连接过来

current_memory

该用户当前占用的内存

total_memory_allocated

该用户总共申请到的内存(历史累计值)


  • memory_global_total视图

total_allocated

Server总共分配出去的内存大小


  • memory_by_thread_by_current_bytes视图

thread_id

MySQL内部线程ID,可以和session视图中的thd_id关联

user

当前线程是哪个用户创建

current_count_used

当前线程正在使用且未释放的内存块(内存块不是固定大小的)

current_allocated

当前线程正在使用且未释放的内存块大小(字节)

current_avg_alloc

当前线程每个内存块平均分配内存大小(字节)

current_max_alloc

当前线程单次曾经分配的最多内存大小(字节)

total_allocated

当前线程总共分配的内存大小


  • statement_analysis视图

query

格式化后的SQL(将SQL中的参数替换成?)

db

在哪个DB中执行,如果为NULL表示在任何DB

full_scan

是否使用了全表扫描

exec_count

SQL执行的总次数

err_count

发生错误的次数

warn_count

发生警告的次数

total_latency

总共发生延迟的时间

max_latency

最大延迟的时间

avg_latency

平均延迟的时间

lock_latency

因锁等待占用的总时间

rows_sent

执行该SQL返回的总行数

rows_sent_avg

执行该SQL平均返回的行数

rows_examined

执行该SQL扫描的总行数

rows_examined_avg

执行该SQL平均每次扫描的行数

tmp_tables

SQL生成内存临时表的总次数

tmp_disk_tables

SQL生成磁盘文件临时表的总次数

rows_sorted

SQL总共排序的行数

sort_merge_passes

用于排序中合并的总次数

digest

该语句的HASH

first_seen

SQL最早出现的时间

last_seen

SQL最近出现的时间


  • processlist视图

thd_id

内部线程ID

conn_id

连接的ID(对应show processlist中的"Id"

user

该线程创建的用户名

db

连接的DB如果是NULL表示后台线程

command

Client发起命令的类型提示

state

命令的状态

time

基于上面state停留的时间

current_statement

该线程执行的语句

statement_latency

语句运行总共占用时间

progress

该语句运行完成的百分比

lock_latency

该语句用于锁等待的时间

rows_examined

该语句扫描的行数

rows_send

该语句返回的行数

rows_affected

该语句影响到的行数(写入语句)

tmp_tables

形成内存临时表的次数

tmp_disk_tables

形成磁盘临时表的次数

full_scan

全表描扫的次数

last_statement

上一条被执行的SQL

last_statement_latency

上一条被执行的SQL时延

current_memory

当前线程占用的内存

last_wait

上一次等待事件

last_wait_latency

上一次等待时间时延

source

上一次等待事件对应的源码位置

trx_latency

事务时延

trx_state

当前事务状态

pid

对应到系统里的pid

program_name

连接进来的标识名


  • session视图

session视图和processlist视图基本一样,只是把后台线程过滤掉。


  • innodb_buffer_stats_by_schema视图

object_schema

schema名

allocated

该schema上分配的buffer pool大小(字节)

data

schema中缓存的数据大小(字节)

pages

该schema中缓存的data page

pages_hashed

该schema中分配了多少hashed page

pages_old

该schema中的old page数量

rows_cached

该schema中缓存的row data数量


  • innodb_buffer_stats_by_table视图

和innodb_buffer_stats_by_schema基本一致,只是比上面那个视图多了一个ojbect_name用于指定表名。

3、sys schema运用

上面把几个基础的视图都介绍完了,接下来就可以回答上篇提出的那些问题了。

  • 哪个用户或者来自哪个IP的客户端使用了最多的资源

查看每个客户端IP过来的连接消耗了多少资源:

查看某个数据文件上发生了多少IO请求:

查看哪个用户消耗了多少资源:

查看总共分配了多少内存:

  • 数据库连接来自哪里,以及这些连接对数据库的请求情况是怎样的

查看当前连接情况:

select host, current_connections, statements from host_summary;


查看当前正在执行的SQL:

select  conn_id, user, current_statement, last_statement from session;

和执行show full processlist的效果相当。

  • 数据库中哪些SQL被频繁执行

执行下面命令查询TOP 10最热SQL:

select db,exec_count,query from statement_analysis order by exec_count desc limit 10;


  • 哪个文件产生了最多的IO,读多,还是写的多

select * from io_global_by_file_by_bytes limit 10;

  • 哪个表上的IO请求最多

select * from io_global_by_file_by_bytes where file like '%ibd' order by total desc limit 10;

  • 哪个表被访问的最多

先访问statement_analysis,根据热门SQL排序找到相应的数据表。

  • 哪些语句延迟比较严重

查看 statement_analysis 中 avg_latency的最高的SQL:

select * from statement_analysis order by avg_latency desc limit 10;

  • 哪些SQL语句使用了临时表,又有哪些用到了磁盘临时表

查看 statement_analysis 中哪个SQL的 tmp_tables 、tmp_disk_tables  值大于0即可:

select db, query, tmp_tables, tmp_disk_tables  from statement_analysis where tmp_tables>0 or tmp_disk_tables >0 order by (tmp_tables+tmp_disk_tables) desc limit 20;

  • 哪个表占用了最多的buffer pool

select * from innodb_buffer_stats_by_table order by allocated desc limit 10;

  • 每个库(database)占用多少buffer pool

select * from innodb_buffer_stats_by_schema order by allocated desc limit 10;

  • 每个连接分配多少内存

利用session表和memory_by_thread_by_current_bytes分配表进行关联查询:

select b.user, current_count_used, current_allocated, current_avg_alloc, current_max_alloc, total_allocated,current_statement from memory_by_thread_by_current_bytes a, session b where a.thread_id = b.thd_id;

  • MySQL内部有多个线程在运行

MySQL内部的线程类型及数量:

select user, count(*) from processlist group by user;

写到这里,其实我们只涉及到 sys schema 很少的一部分功能。估计MySQL的官方AWR也要快出现了,大家也可以期待一下(MySQL 8.0这块又进一步规范了一下)

本文要特别感谢 知数堂 徐伟 同学的校验。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存