状态快照转移:一种MySQL Galera集群较优的备份方法
作者介绍
王晶,中国移动DBA,负责“移动云”业务系统的数据库集成架构设计、运维、优化等工作;擅长技术领域MySQL,获Oracle颁发的“MySQL DBA”官方认证,熟悉MySQL复制结构、MHA、cluster等多种架构及运维优化。
MySQL Galera Cluster是一套基于WSREP进行同步复制的集群解决方案,配置和使用相对简单,具有多节点同时提供读写、可用性高、强一致性和快速扩展的特点。由于它能够分担读写压力,且具有较强的数据一致性,因此在很多企业的生产环境得以应用。本文旨在说明一种适用于MySQL Galera集群的备份方案。
Galera集群说到底也是MySQL,因此也可以普通的数据库备份方法来备份cluster的节点数据。但普通的备份方法缺少GTID,也无法把MySQL节点恢复到预设某个时间点的状态。而且,一些备份程序运行时可能会阻断集群的正常业务操作。所以对于MySQL Galera集群,官网推荐采用状态快照转移的方式来备份。
从数据库本身的角度来说,通过state snapshot transfer对galera cluster的一个节点做备份和对单实例做一个完整的数据备份是非常相似的。这两种情况下,数据库节点都使用相同的机制,联合GTID和database状态来创建一个库内容的全备份。而所说的用快照转移的方式备份,本质上就是用类似于快照转移的方式来触发一个脚本,这个脚本可以同时实现以上备份过程和galera仲裁者守护进程。(示例来自官网)
这条命令触发了donor节点,也就是备份的来源节点,去调用wsrep_sst_backup.sh脚本,通过环境变量的配置, mysqld进程可以找到这个脚本。donor节点会选取数据库没有任何变更进行的时候跑这个备份脚本,传递当前状态对应的GTID。上面的示例中‘gmcast.listen_addr=tcp://0.0.0.0:4444‘是一个仲裁监听socket地址,用来与cluster通讯的,默认是0.0.0.0:4567 。
当然,也可以不使用galera默认提供的这个脚本,当你不满足于这些进程提供的默认操作时(当一个节点发送或接收一个状态快照转移时,是通过跑一个独立于database server的外部进程来管理它的),galera cluster提供一个接口给用户shell 脚本来管理节点上的状态快照转移,自身也同时提供了一个普通脚本用于管理状态快照转移,你可以用它来作为创建自己脚本的基础起点。该脚本的文件名为wsrep_sst_common.sh。Linux下默认安装在/usr/bin。
wsrep_sst_common.sh这个SST脚本提供解析参数列表、错误记录等的现成功能。并且没有对参数顺序和数量的约束,可以根据自身情况增加或忽略某些参数。
它假定只有在状态转移之后,接收节点的存储引擎初始化才进行。意味着它直接拷贝源数据内容到目的数据目录。
当Galera cluster启动一个外部进程做状态快照转移时,会传递一些参数来配置状态转移脚本。常见的参数有以下几类:
1.通用参数:这些参数所有的状态转移脚本都会用到,无论发送还是接受节点。
role:区别donor或joiner
address:joiner的IP地址,joiner可以用wsrep_sst_receive_address这个参数来配
auth:权限信息,可通过wsrep_sst_auth参数来配
datadir:脚本所需的数据目录来源于mysql_real_data_home这个参数
defaults-file:my.cnf的路径
2.donor特有的参数:这些参数只被用于donor
gtid:节点给出的GTID来自于state UUID和sequence number或seqno
socket:如果需要,可以配置本地server的socket用于通信
bypass:节点用于甄别是否跳过实际数据的传输,只传递GTID,也就是说该节点是否应该启动增量状态传输
3.逻辑状态转移特有的参数:这些参数只被传递到发送和接收端的wsrep_sst_mysqldump.sh脚本中。
user:用来连接joiner和donor的数据库的用户,两边都应该一致,用wsrep_sst_auth参数来定义
password:用来连接joiner和donor的数据库的用户,两边都应该一致,用wsrep_sst_auth参数来定义
host:joiner的IP地址
port:joiner的端口
local-port:发送状态转移的端口
不管用默认的自带脚本,还是自己写脚本,启动的过程都是一样的。文件名必须是wsrep_sst_<name>.sh。name是wsrep_sst_methord参数的值。receiver接收并应用transfer完成之后,会输出接受节点的标准GTID,退出脚本,返回状态0,说明状态转移成功。sender在完成传输后,会发送一个done\n的信号,当脚本收到这个信号之后,会返回0值退出。
通过状态快照转移机制来调用buckups有以下几点好处:
节点可以在一个特定的时间点来启动备份,这个时间无需人工选择干预,数据库会自动选择一个没有任何影响数据库的变更执行的时间点。
这种备份方式会把GTID和备份相关联,对于可能发生的潜在数据丢失或损坏故障,便于使用GTID进行修复。
备份时节点与cluster不再保持同步,避免做备份时影响带宽性能,备份进程更不会阻断节点。
集群能够自主判断某个节点正在执行备份,就不会选这个节点再作为另一个节点的donor。
(注:本文所引用案例,均来自galera官网:http://galeracluster.com/)
◆ 近期热文 ◆
引以为戒:记一次心惊肉跳的服务器误删文件的恢复过程
高可用系统设计精要: 定个能达到的小目标,比如先读完本文
解DBA之惑:数据库承载能力评估及优化手段
你和高级工程师的差距,仅有六步之遥!
唯品会大数据存储和计算资源管理的痛、解决方法与思路
◆ 专家专栏 ◆
◆ 近期活动 ◆
Gdevops全球敏捷运维峰会广州站
峰会官网:www.gdevops.com