金融行业双活建设中常用的十个知识
2、同城,用于关键系统的双活,应对盘机故障以及机房级故障。
3、异地一般不会做双活,可以用改技术来做灾备。
2、双活数据中心的建设路线如何来规划和实践?
1、首先要确定实施双活的目标,AS、AQ还是AA?RPO?RTO?不同的目标实施方案及成本是完全不同的。
2、其次要梳理实施双活的应用范围,双活可以带来业务连续性的保障,但同时也增加了架构的复杂度和运维的复杂性,不是所以的业务系统都需要做到双活。
3、第三,对需要做双活的业务系统进行架构分析,BS还是CS,有无负载均衡,使用什么数据库等等,分析的结果是要决定在双活架构中如何把这些因素都考虑进去。
4、双活的运维架构,如自动化切换系统,人工触发还是告警系统自动触发?两边的系统如何一体化监控?等等
5、组织架构或管理流程也要同步考虑,双活的两个站点必须要能一体化管理。
3、同城双活建设时注意事项有哪些?
考虑到双活涉及到应用、网络、数据等多个维度,网络和数据方面容易解决一些,应用上如果是比较老的系统有些不支持分布式部署或域名访问的,所以,整体考虑,核心系统更换或改造时比较适合同步建设同城双活,这样,在前期从应用出发按照双活架构来进行规划设计,后面只需要按规划分阶段实施。
注意事项有以下几点:
1、应用必须支持分布式部署架构,并支持使用域名访问数据库。
2、生产机房和同城灾备机房链路质量要有一定保障。
3、根据监管要求,按照业务等级来规划方案,不同的等级采用不同的保护策略。
4、存储双活对应用层有什么要求,才能实现真正的双活?
1、存储双活对应用层没有要求,存储双活从层次上来讲,有几种实现方式。
一:存储层(SAN存储或NAS存储)自身,体现为免网关双活的存储设备;
二:SAN网络层,存储网关,代表性的:VPLEX,SVC等;
三:卷管理软件层,代表性的LVM,Veritas的SF(现在不叫这个名字了)等,其实广义上,我认为可以将ASM也可以划分为第三种方式,只是这种只适用于有限Oracle DB的场景
2、真正的双活应该是多层次的,分别对应的是容灾的6个级别(中国标准),国际标准是7个级别的,存储双活只是最底层的,其他的还包括传输层、网络层(含负载均衡)、计算层、应用层、数据库层、安全层等。
5、同城双活建设时系统迁移如何进行?
1、纳入同城双活的系统,一般是业务连续性要求比较高的系统,比如核心账务系统、网上银行系统等,参照监管部门5级灾备要求确定。
2、本地高可用和同城双活在技术上还是有较大差别,需要重新设计方案的,比如本地HA机制一般需要心跳线来保障,而心跳机制是有网络延时限制的,也就是说有距离的限制,不能适用于同城这样的距离上。
3、应用系统的同城架构建好后,各自承担多少负载要看所建设的双活模式。如果是AS模式,那么同城机房是不承担业务量的。如果是AQ模式,可以把一些纯查询或报表类业务放在同城机房。如果是AA模式,理论上每个机房是可以承担50%的业务量的,当然要看两个机房资源配置是否对等了
6、如何避免双中心存储双活的情况下发生脑裂的情况?
双活部署在同城跨双中心模式时,中间传输链路故障的发生,是不可避免的事情。
唯一能做的就是,确保仲裁在第3站点是独立部署,确保在脑裂时候,可以正确的选择出其中一个站点存活。
7、数据层如何避免或者减少跨中心热点数据的竞争,从而减少数据访问过程的数据冲突风险?
这是双活系统设计中的一个难点。两个站点同时对一份数据进行频繁地读写,很容易导致数据库为了一致性而牺牲性能。
一种比较简单的方式按区域分片,比如南方片的用户流量导入A中心,北方片的用户流量导入B中心,各自访问自己的记录,这样可以减少一部分数据冲突,但不彻底。
比较好的做法则是需要应用侧精心设计,同一应用在不同中心实际上业务类型不完全一致,比如一个购物系统,商品页面流量全部导入A中心,购物车流量全部导入B中心,访问的是不同表,zhe yang可以最大限度减少数据冲突。
8、异地备份作为数据中心的第三份数据保护,最常用的有哪些技术?
1、Oracle dataguard,带宽根据数据量大小可选择2MB-20MB专线。
2、第三方备份软件,如veritas NBU的AIR技术可将数据复制到异地机房,带宽根据数据量大小可选择2MB-20MB专线。
3、在生产机房将数据备份到NAS存储介质上,借助NAS存储设备的复制功能将数据同步到异地NAS存储设备上,带宽根据数据量大小可选择2MB-20MB专线。
以上,可根据场景和需求选择相应的解决方案。
9、在同城双活模式下,如何避免人为误删除文件或者数据?
站在数据库或是存储的角度,都不存在所谓误删除一说,所有的删除动作都是用户发起的合法动作。因此,为应对用户的操作错误,除了定时的备份或快照等机制外,从源头上进行控制也是有必要的,比如运维用户不得拥有高风险命令的执行权限,如必须要执行删除等危险动作,则必须要单独申请权限并双人复核。
双活模式下,也要加强数据备份的管理工作,最好有统一的备份系统,平时做好恢复演练。
10、发生故障时,应用如何进行切换,切换后的回路逻辑如何规划等等?
1、在双活数据中心的实际运行过程,一项很重要的工作是就是要做好各种情况下的应急预案,包括负载均衡类的单台服务器故障、非负载均衡的单台服务器故障、存储故障、交换机故障、整个应用故障、整个站点故障等情况。
2、重点关注的还是类似数据库这样的非负载均衡数据库,切换时要综合考虑,比如从主站点切换到备站点时,要考虑应用服务器连接到数据库服务器的配置变化。
3、CS模式和BS模式切换时会有所不同,BS应用一般采用域名访问,但CS应用一般配置IP地址,在发生切换时要特殊进行处理。
4、此外要注意,切换的方案中真正的故障切换和切换演练会是两套方案。
相关推荐:
存储跨中心双活方案设计阶段十大难点解析
http://www.talkwithtrend.com/Document/detail/tid/40623
欢迎关注社区 "双活"技术主题 ,将会不断更新优质资料、文章。地址:
http://www.talkwithtrend.com/Topic/71
下载 twt 社区客户端 APP
与更多同行在一起
高手随时解答你的疑难问题
轻松订阅各领域技术主题
浏览下载最新文章资料
长按识别二维码即可下载
或到应用商店搜索“twt”
*本公众号所发布内容仅代表作者观点,不代表社区立场