查看原文
其他

实战 | 打造网络数字化运维基座

金融电子化 金融电子化 2023-01-22


欢迎金融科技工作者积极投稿!

投稿邮箱:newmedia@fcmag.com.cn

                                          ——金融电子化



      

文 / 中国银联股份有限公司  袁航  施海捷  吴志强  严峻岭

随着金融数字业务的飞速发展,金融数据中心的规模不断扩大。在此过程中,上层业务对数据中心网络的平稳性和快速性要求越来越高,同时网络规模不断扩大,网络架构愈发复杂,给网络运维工作带来巨大的挑战。针对上述挑战,基于中国银联电子商务与电子支付国家工程研究中心工作平台,银联与华为联合成立金融网络研究团队,共同开展金融数据中心网络运维数字化转型研究工作。


数据中心网络运维方式向

数字化发展

回顾数据中心网络运维方式的发展经历,主要有三个阶段:手工运维、自动化运维和数字化运维。推动变革的诱因,除上层业务对网络的要求不断提高之外,还存在着两大内生推动力:网络基础设施的变化和网络新技术的应用。


1.手工运维到运维自动化。随着云计算技术在金融数据中心落地,数据中心网络发生较大变化:从基础设施层面看,云计算的落地带动数据中心网络急速扩张,管理架构从扁平化转向区域化,同时网络边界渗透到了计算节点内部;从网络新技术应用看,虚拟化网络引入冲击了传统网络技术体系,VXLAN、GRE、OpenFlow等技术开始在数据中心内使用。上述变化,使得网络运维工作量和难度大幅增加,手工运维已难担重任,以SDN为代表的网络自动化运维开始成为数据中心主流。


2.运维自动化到运维数字化。随着网络基础设施的不断演进,云计算集群数量增加、多中心建设及信创设备的推广普及使得网络运维的工作量和难度进一步提高;在新技术应用方面,以IPv6为代表的网络新技术开始在金融数据中心铺开应用,相关路由、Qos、安全等配套协议的升级,以及以SRv6、TFIT为代表的IPv6+创新技术的应用,进一步对运维工作提出更大的挑战。网络运维由自动化向数字化转型的趋势凸显。


数据中心网络数字化运维能力特征

1.全,即具备对底层设备的全量统一管控。此为建设数字化运维能力体系的基础:首先,需要打破区域化的设备管理边界,实现对整个数据中心全量设备的纳管,构建整体数据中心数字网络系统;其次,以统一、标准化的方式进行管控,杜绝对少量设备的个性化管理方式,进而建立高效一体化的管控模式。


2.捷,即能够敏捷高效地构建网络运维能力。首先在设备层面能够快速构建设备驱动,面对新设备以及新应用技术,实现快速适配纳管;其次在业务层面,利用数字化手段自主编排实现运维业务,进一步提高运维效率。


3.智,即实现智能网络。采用智能化技术重构整个网络架构和运营体系,进一步提升网络运维效率。通过机器学习和深度学习等AI技术的应用,实现网络状态可感知、风险隐患可预测、整体可视化的网络。


打造网络数字化运维基座

1.新一代网络设备统一管控平台定位。该平台定位为网络数字化运维底座,需要实现“全”和“捷”两大能力。在整体网络运维体系中,平台定位在网络运维中台,南向(向底层)与网络硬件设备对接,形成设备驱动管理能力;北向(向上层)提供RestAPI接口,供业务及管理侧自动化运维系统调用。


2.新一代网络设备统一管控平台解决方案。一是基于NETCONF协议实现设备的标准化纳管。NETCONF是基于XML结构化文本的网络配置和管理协议,基于简单的RPC机制实现客户端和服务器之间通信,控制端可以对交互数据进行高效解析。但由于一些老旧设备仍不支持NETCONF,研究团队决定采用NETCONF与命令行共存,优先使用NETCONF的方案进行设备管控。在满足全量设备纳管这一前提下,较大程度实现了交互数据标准化的目标。未来随着老旧设备的逐步退网,可实现NETCONF对设备进行全管控;二是基于模型开发的低代码技术实现运维能力快速构建。实现低代码开发,首先需对构建的能力进行标准化建模。YANG是一种通用类json格式的建模语言,其对NETCONF天然契合。因此我们采用基于Yang模型的低代码开发实现网络运维能力的快速构建。


首先在平台中实现YANG模型的解释引擎。该引擎可根据YANG到NETCONF的转化逻辑,自动根据YANG模型内容生成相应的NETCONF控制报文。在功能开发中,只需制定YANG模型即可,平台会根据YANG模型自动生成功能接口;其次在设备能力层之上构建了业务功能层,通过对设备功能的编排,即可快速、灵活地构建出网络运维相关业务。

图1  业务模型到设备驱动模型映射示意图


3.新一代网络设备统一管控平台架构设计。平台整体南北向分为4层结构,由南向北依次为南向通信通道层、设备驱动层、业务功能层和北向API接口层。各层功能规划如下:一是南向通信通道。负责与网络设备建立通信通道,能够对不同的设备进行统一纳管,平台支持NETCONF与命令行STelnet两种通信方式。二是设备驱动层。以设备功能视角,完成对设备的管控;不同的设备类型对应不同的驱动包,开发模式为基于YANG模型的开放可编程方式。三是业务功能层。从业务视角,完成配置流程的拆解编排,不同的业务对应不同业务功能包,开发模式为基于YANG模型的开放可编程方式。四是API接口层。内含平台功能性接口(如增加设备、查询设备信息等),设备层接口(设备驱动层的北向API)以及业务层接口(业务功能层API)。

图2  新一代金融数据中心网络设备管控平台架构


4.平台效果验证。基于上述设计,研究团队采用自研业务编排系统结合华为iMaster NCE-Fabric开放可编程框架AOC的新模式,完成了平台原型实现。同时在数据中心数据采集场景中试用。之前采用命令行的方式进行,采集数据种类多、数据量大,且结果都是文本数据,难以提取有效数据,相关代码开发和维护工作量大。针对该场景,我们使用了新平台进行能力构建。具体试用情况如下表所示。


表  交换机数据采集业务试用情况


未来展望

新平台相关能力还可以进一步完善提升。如在设备驱动构建方面,YANG能力已经被许多厂商整合到了设备中,未来是可以实现设备驱动的自动化生成,做到“接入即纳管”;另外中国银联将与华为进一步开展“智”方面的能力建设,在平台基础上进一步叠加网络智能化的能力。


从行业来看,网络运维数字化转型是未来趋势。该平台是一个开放的框架平台,具备向全行业推广应用的条件,各机构可根据自身需求情况基于平台进行能力自开发。中国银联也希望与各行业伙伴机构共享成果,共建和繁荣金融网络数字化生态。


(栏目编辑:张丽霞)






往期精选:

(点击查看精彩内容)


● 实战 | 数据治理的探索与实践

● 实战 | 保险核保智慧体检体系建设

● 实战 | 追求卓越,砥砺前行——小型机下移x86开放平台最佳实践

● 实战 | ISO 20022 报文库和我国金融报文库应用情况

● 实战 | 数据驱动效能——软件测试效能改进中的度量实践







新媒体中心:主任 / 邝源  编辑 / 傅甜甜  张珺  邰思琪

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存