银行业关键交易类核心系统同城双活设计 11 个经验分享
为了能更好的解决银行同仁在实现同城双活时面临的难点,twt社区最近特别邀请了在这方面有着丰富项目实践经验的某省农信专家等业内同行,在线下一起交流探讨和分享经验。为了给更多读者提供参考,将本次交流中的一些问题解答整理成以下文章,其中部分内容基于某农信的实践分享。
1、某农信的SVC有多大规模?
邓老师:
目前SVC用在很多个方面,基本上除了核心业务系统没有SVC之外,其他交易类业务系统、管理类业务系统、开发测试环境、带内管理业务系统都分别用到了各自的SVC集群,总体来说SVC功能还是非常好用的,在存储数据迁移、冗余保护、同城灾备、双活等发面功能都很齐全,存储维护变得更加灵活和便捷,高可用架构也更加健壮。
2、双活是否会造成性能的下降?
邓老师:
双活必然带来读写IO性能的下降,这点是必然的,因为每一个写IO都会同步到另一个存储节点中,存在链路往返延迟,随着链路间距的增加,延迟也越来越大,势必和存储直接IO的延迟在同一个数量级,在业务端看来,这种延迟的增加是双活技术所带来的。
赵老师:
会,使用存储双活架构会造成存储I/O的写延迟增加,导致业务系统的写性能下降。
3、HyperSwap是否需要两套SVC?成本是几倍?算双活还是灾备?
邓老师:
HyperSwap是需要两套SVC,也就是2套SVC IO GROUP,总计四个SVC节点,成本来看是一套SVC的两倍上下,这种技术算是存储网关双活技术,对于底层存储而言,准确地说是灾备,因为SVC HyperSwap的两套SVC节点都是ACTIVE-ACTIVE,但底层存储实际上是ACTIVE-STANDBY。
赵老师:
HyperSwap需要两套SVC和两套粗U难处。从存储成本来说相对于单套SVC+单套存储就是两倍。如果考虑实施费用,和数据中心间链路以及第三个仲裁站点的费用,那就会更高。HyperSwap是双活技术。
4、还有什么其他不错的产品建议?
邓老师:
EMC的VPLEX,NetApp MetroCluster等。
赵老师:
目前来看,独立的SAN存储虚拟化控制器技术有IBM SVC和EMC Vplex。
5、HyperSwap或SVC是否需要和DB2高度耦合?
邓老师:
不需要和DB2高度耦合,SVC hyperswap是存储层的双活技术,DB2双活像DB2 PureScale是数据库事务级的双活技术,但需要和底层存储一起结合实现完整的数据库双活方案,目前DB2 PureScale和GPFS结合的比较紧密,是一个打包的成熟方案,落地案例也很多,但理论上HYPERSWAP+DB2 PureScale也是可以的,需要注意的是存储双活仲裁和DB2双活仲裁的一致性问题。
赵老师:
和DB2高度耦合的双活技术是DB2 Purescale。Hyperswap无法和DB2高度耦合。SVC是经过DB2认证的存储虚拟化产品。
6、分布式存储和集中式存储的对比?价格方面及维护难度方面?
邓老师:
集中式存储的维护其实要比分布式存储简单,价格方面,如果分布式存储用的开源产品,没有涉及软件费用的话,分布式存储价格更占优势,如果分布式存储需要购买分布式存储软件许可的话,总体拥有成本,也不会占明显优势,基本和集中式存储持平。
赵老师:
一般而言,金融客户的核心系统都是基于数据库的结构化数据,单套系统的数据量都不会太大,此时适合集中式存储。分布式存储一般适合的是互联网类型的应用,其特点一般是数据量非常大,而且以非结构化数据为主。价格的话分布式存储的每TB成本肯定低于集中化存储,但是由于其数据量都很大,单套分布式存储的投资应该是高于集中式存储的,维护复杂度也高于集中式存储。
7、对象存储,PB级,用的什么盘?协议是用的ceph还是S3?
邓老师:
目前主流对象存储的访问协议是S3、Openstack Swift、Simple Object等Rest API接口,用的盘也是主流的SAS盘,是一个软件定义存储解决方案。
赵老师:
用大容量NL-SAS盘(单盘8T,10T),S3协议
8、国内谁实现了真双活,做到秒级切换?
邓老师:
很少城商行通过SVC实现了本地或者同城存储双活,切换也可以达到秒级,但对于一个业务系统而言,存储双活只是其中一部分,真正要实现业务系统级别的双活和秒级切换还需要其他技术的支持,像数据库双活,应用集群和全局性负载等,作为整体性的切换,RTO要实现秒级还是有些难度,目前这块暂未见到。
赵老师:
据我所知工商银行做到的,可参考:
独家揭秘:IBM GDPS 零数据丢失助力“宇宙行”实现双活2.0
9、SVC ESC 如果宕机了,对业务影响如何?
邓老师:
单个SVC ESC节点宕机了,存储路径可以自动切到另一个节点,如果两个SVC ESC宕机了,可以切到另一组SVC ESC节点组中。切换过程可以达到秒级。
赵老师:
ESC是基于SVC I/O Group的拉伸集群,如果部署两个I/O Group,即四个SVC节点,那么不管是单个SVC节点故障,还是两个SVC节点故障,都可以做到对业务无影响,除非是四个节点同时宕机,才会影响业务。
10、DB2 pure scale双活上线有遇到什么问题?
邓老师:
在规划和测试阶段发现了一些问题,都提前在上线前通过以下手段进行了规避,如:
(1)两个站点的应用节点只访问本站点的数据库成员节点,数据库成员节点只访问本站点的GPFS NSD存储
A、需要配置DB2客户端(应用端)亲缘关系与GDPC配合使用
B、需要在DB2客户端配置跨站点的冗余性,提供容错功能
C、两个站点的GPFS NSD盘的属性需要优先本地站点的成员节点
(2)减少访问CF集中缓存、GPFS NSD的网络同步带来的影响
A、节点间通信尽量使用高速互连网络(推荐Roce)
B、尽量减少通讯,减少热点数据竞争,使用小PageSize,增大GPFS缓存,数据库缓存,减少大量日志写入
C、采用数据库分表、分区,避免热页面
D、将不同的应用分布在不同的节点上,利用业务分割的方式,来保证整体双活数据库性能
11、某农信的400用的什么复制技术?
邓老师:
目前AS400本地和同城灾备用的DS8870存储的MGM同步技术,本地两套AS400主机和两套DS8870存储,做的MM同步,同城灾备用的一套AS400和一套DS8700存储做的GM同步。
欢迎关注社区 “双活”等相关技术主题 ,将会不断更新优质资料、文章,您也可以前往提出疑难问题,与同行切磋交流。
双活:http://www.talkwithtrend.com/Topic/71/blog
SVC:http://www.talkwithtrend.com/Topic/943
下载 twt 社区客户端 APP
与更多同行在一起
高手随时解答你的疑难问题
轻松订阅各领域技术主题
浏览下载最新文章资料
长按识别二维码即可下载
或到应用商店搜索“twt”
*本公众号所发布内容仅代表作者观点,不代表社区立场