其他
分库分表后,如何保证数据一致性?
来自:掘金,作者:小泥洼
链接:https://juejin.cn/post/6933003178661462023
前言
通过对数据的垂直拆分或水平拆分后,我们解决了数据库容量、性能等问题,但是将会面临数据迁移和数据一致性的问题。
在数据迁移方面,需要考虑如何快速迁移、平滑迁移、不停机的迁移等。待数据迁移完毕后,还需要校验数据的完整性。
数据一致性方面,要根据的业务来判断是否要必要引入分布式事务,如果需要引入分布式事务,需要斟酌是采用XA,还是基于BASE的柔性事务。
数据迁移
全量
全量迁移的过程如下:
业务系统停机。 数据库迁移,校验数据一致性。 然后业务系统升级,接入新的数据库。
缺点:
需要业务系统停机 迁移时间较长,对业务影响较大。如果是异构数据的话,需要使用程序来处理,迁移时间更长。
全量+增量全量+增量迁移的方式,需要依赖数据本身的创建时间,步骤如下:
先同步数据到最近的某个时间戳(创建时间)。 然后发布系统升级维护的通知。 然后同步最近一段时间变化的数据。 最后升级系统,接入新的数据库。
binlog+全量+增量
分布式事务
XA分布式事务
XA分布式事务,是数据库本身支持的协议,具备强一致性。
应用程序(Application Program, 简称AP): 用于定义事务边界,即事务的开始和结束,并且在事务边界内对资源进行操作。 资源管理器(Resource Manager, 简称RM): 如数据库、文件系统,并且提供访问资源的方式。 事务管理器(Transaction Manager, 简称TM): 负责分配事务唯一标识,监控事务的执行进度,并且负责事务的提交、回滚等。
xa_start 负责开启或者恢复一个事务分支 xa_end 负责取消当前线程与事务分支的关联 xa_prepare 询问RM是否准备好提交事务分支 xa_commit 通知RM提交事务分支 xa_rollback 通知RM回滚事务分支 xa_recover 需要恢复的XA事务
同步阻塞:全局事务包含了多个独立的事务分支,这一组事务分支要么都不成功,要不都失败,各个分支的ACID特性共同构成了全局事务的ACID特性。如果对读操作很敏感,需要将数据库的隔离级别设置为SERIALIZABLE,性能特别的差。 单点故障:TM存在单点故障,需要考虑TM高可用性。 数据不一致:极端情况下,会出现事务失败问题,需要监控和人工处理。即二阶段commit请求后,发送网络故障,只有一部分RM收到请求,其他节点没有收到Commit请求的情况。
柔性事务
基本可用(Basically available),分布式事务参与方不一定同时在线。 柔性状态(Soft state), 允许系统状态更新有一定的延迟,出现一些中间状态,这个延迟对客户来说不一定能够察觉。 最终一致性(Eventually consistent),通常是通过消息传递的方式保证系统的最终一致性。
TCC: 通过手动补偿处理 AT: 通过自动补偿处理
TCC介绍
Try:准备操作,完成所有的业务检查,预留业务资源。 Confirm:真正执行的业务逻辑,不做任意的业务检查,只使用Try阶段预留的业务资源。因此Try操作成功,Confirm必须能成功。同时,Confirm操作必须保证冥等性,保证一笔分布式事务能切只能成功一次。 Cancel:释放Try阶段预留的业务资源,同样Cancel操作也必须满足冥等性。
允许空回滚,即try没有完成资源预留,允许短路操作。 防悬挂控制,即需要保证,cancel必须在try之后才执行。 冥等性设计,即需要保证confirm和cancel需要保证冥等性,防止网络因素导致数据混乱。
第一阶段,业务数据和回滚日志记录在同一个本地事务中提交,释放本地锁和连接资源。
第二阶段,提交异步化,非常快速的完成,回滚的话通过一阶段的回滚日志进行反向补偿。
柔性事务下的事务特性
原子性:正常情况下保证 一致性:某个时间点,数据存在不一致,但是最终是一致的。 隔离性:某个时间点,A能读到B事务未提交的结果,即会脏读现象。 持久性:和本地事务一样,只要commit则数据就会被持久化。
总结