案例丨云原生 :加速数字化智能化的新基石
文 / 百度副总裁 李硕
云原生的趋势与挑战
越来越多的金融机构将IT基础设施云化战略作为提升数字能力的关键举措。在疫情影响下,服务线上化加速了云化基础设施在金融行业内的落地推广。如果说从集中式到分布式,完成“上云”,是金融云1.0的目标,那么真正内化和发挥云的能力,则是金融云2.0的课题。2022年是金融云1.0迈入金融云2.0的关键一年。在金融云1.0阶段,主要是解决规模增长与服务可持续性带来的系统性问题。同时,挑战也普遍存在,如核心业务层感知不明显,对业务快速迭代、数字化发展的支撑不直接,无法完全技术自主可控等挑战。我们认为,金融云1.0模式是基础,是练兵,而在金融云2.0阶段,将以云原生为主体,融合AI原生,通过自主可控,安全可靠的全栈技术体系重塑金融业务应用开发模式,为金融机构数字化,智能化提供直接、有力的支撑。
金融行业云原生的技术
实践路径
云原生通过对微服务、容器化、服务网格、持续交付等核心能力的应用,系统化支持科技团队敏捷响应与快速灵活的业务需求。同时在金融行业监管要求高、历史积累的应用系统复杂度高的背景下,应用云原生技术仍需面对开源软件安全性、业务改造成本、应用开发模式转变等挑战。
集中式应用架构:应用架构简单可靠,但规模扩展难度高、服务性能扩展性差,难以支持业务迭代发展。分布式应用架构:部分的解决集中式的扩展性问题,但是功能模块拆分缺乏标准化体系,模块化的界限难以统一,影响业务创新与迭代发展。微服务应用架构:将应用系统按照功能模块拆分成多个独立自治的有明确边界的微服务,通过松耦合方式提供灵活部署扩展、快速迭代支持,但是存在一定的技术门槛和服务治理要求,是云原生的核心架构模式。
微服务应用架构对应用的设计实现提出了更高要求,金融机构应用云原生势必会有一定的挑战,但同时,云原生的技术体系也提供了集中式到微服务、分布式到微服务等灵活的实现路径。金融机构可结合自身科技发展水平及业务发展诉求,打造基于云原生的IT架构新体系。
结合金融行业应用云原生过程中的痛点与需求,百度智能云尝试构建了一站式金融级云原生平台——天合平台,支撑容器云管理、云原生业务开发、云原生可观测等需求场景。
图1 百度智能云金融级云原生平台
——天合平台
金融行业典型场景和实践案例
1.以金融级云管平台提供信贷业务上云一站式支撑——容器云平台实践。开源云原生软件操作上以命令行为主,且不同版本的安全和稳定性差异较大。天合云原生管理平台提供全流程可视化能力,一站式实现业务上云的弹性部署及快速迁移,提升资源利用效率并降低用户使用成本与学习难度。
某互联网银行在业务发展战略驱动下,对信贷业务系统提出了重构要求。面对大量的功能需求,以及后续快速迭代的目标,在项目建设中,重点从云原生平台与CI/CD流水线对接、分级发布、测试环境快速构建等角度进行能力建设,实现信贷业务的双活容器化部署以及测试环境的容器化改造。
CI/CD流水线对接:云原生容器平台实现了与行内原有CI/CD平台的对接,保持行内原有的审批流程不变的同时,支持容器镜像在预生产、生产环境之间的发版变更。分级发布:在容器既有变更策略的基础上,增加了发布暂停、分批发布等接口能力,支持了应用程序分级发布、自定义回退等能力。测试环境快速构建:支持研发人员以个人粒度申请测试环境,通过最小集管理、中间件容器化、预制测试数据集等方式达成效果,解决行内测试环境冲突的困扰,极大提升应用系统创新迭代的效率和质量。
2.低成本快速重构手机银行业务流程——某国有银行云原生业务开发平台实践。金融机构在进行云原生试点时,通常会从历史包袱相对较少、业务创新发展诉求高、服务访问量增长快的业务场景入手。运用天合云原生平台的函数计算能力,用户可以仅关注业务逻辑的核心代码,而无需关注和配置周边组件,极大降低服务架构搭建的难度。
在疫情影响下,某国有银行手机银行业务面临大量新业务开发和原有业务线上化改造的压力。通过应用函数计算Serverless能力与行方现有的分布式、云计算技术平台做对接,为应用开发提供完整的函数核心引擎、函数管理能力、开发交付能力,并全面对接存储、日志、监控、持续集成等能力,构建统一的函数计算应用开发平台,支持众多业务场景建设。
应用后端服务:通过在函数内组合多个API、渲染页面、直接编写业务逻辑等方式构建后端服务,用于小程序、H5等场景。批量任务:支持在函数内编写批量处理逻辑,并可用函数工作流实现多个批量逻辑的组合。模型发布:针对AI模型用量不稳定、发布频率非常高的问题,通过将训练好的模型以函数计算快速发布的方式,高效实现如RAS智能基金组合回测等模型的发布。
3.及时全面的故障发现保障下一代核心系统高可靠运行——某国有银行云原生可观测平台实践。在金融机构的新一代核心系统建设中,业务的分布式、云原生对监控系统的高弹性带来了新挑战,监控系统极限需要支撑亿级的指标量级。天合云原生可观测平台的弹性与可扩展性为生产环境的故障处理提供了良好基础,能够帮助业务在流量突增、资源环境异常时做快速的干预。
某国有银行下一代分布式核心系统建设中,百度智能云提供了云原生可观测平台,一方面借鉴Prometheus联邦的思路,从采集层做预聚合减少指标量级,同时优化架构性能,支撑更大规模的分布式系统,保障了新核心建设的顺利实施。后续将进一步探索监控智能化,集成智能异常检测、根因定位等能力,为新核心系统的平稳运行保驾护航。
与数字化、智能化相匹配的
理念与治理模式升级
云原生并不仅仅是一类技术工具,需要内化于组织中,成为驱动科技变革的方法和思维。云原生的落地需要“跳出科技看科技”,从理念、方法、工具和协作流程等多个角度与业务部门、业务流程融合贯通。科技部门可以选拔兼具业务、技术能力的“内部布道师”,影响上下游的组织中应用需求、开发、测试、运维等多个环节,形成三个一:一套语言,一套方法,一套思维,为数字化转型和智能化升级打好广泛的“群众基础”。
我们可以将云原生治理与变革工作简单概括为“三步走”:第一步,主动影响并建立适应云原生的整体组织架构;第二步,重构产研运等各方协同的流程机制与微服务的治理标准;第三步,明确关键能力并培养关键人才。
适应云原生的组织架构:考虑通过设置专项架构治理委员会、在各条线中增设业务架构岗位、自培/聘请敏捷教练等方式,形成“全面覆盖、专项跟进、理念赋能”的垂直化组织,以适应稳敏双态的业务开发模式。
流程机制与治理标准:围绕“敏捷”目标,一方面贯穿需求整理、迭代规划、开发测试、发布更新,围绕全生命周期制定清晰、高效的团队协同机制;另一方面制定各项治理标准和评价体系,并全面宣贯至相关部门及员工中,保障云原生转型真正落地。
关键人才能力培养:当前金融机构中具备微服务拆分经验的专业人才稀缺,需注重云原生关键能力(如应用框架设计、数据架构设计、业务模块理解)的识别,并做好对应人才的招聘与培养工作,可考虑通过建立内部技术社区、沉淀知识库、提供相应培训课程等方式,打造自身的人才竞争力。
云原生融合AI原生,支撑
业务数字化智能化的变革
人工智能是应用驱动型技术,落地后的业务感知度高。因此AI应用正在快速融入前中后各业务流程中。在金融云2.0阶段,以云原生为主体,融合AI原生的模式已经不断涌现。融合AI原生的数字化底座,具备将AI原子能力(语音、图像、自然语言理解、知识图谱)直接植入应用的能力。
图2 AI应用渗透至金融机构
前中后各业务流程(银行为例)
以线上商城的营销活动为例,活动期间CPU服务器资源需求急速提升,同时在营销模板/视频内容自动生成、商户图片内容审核、评论区内容分析、在线智能对话等方面,对GPU资源的需求同样会快速拉升,且此类智能化应用通常需要结合场景进行模型快速调整和编排发布。
AI原生云一方面提供面向AI场景的包含CPU和GPU的分布式弹性资源集群;另一方面在应用开发层面提供面向AI应用场景的一系列低门槛开发平台。算力层面与开发层面的结合,使得智能化应用从开发、测试、发布到弹性高可靠运行都能够在AI原生云上快速高效开展。
结束语
云原生将是一场面向业务场景,服务于业务场景的革新。其更高效的资源调配能力、更敏捷的开发速度及更卓越的灵活性,将为金融机构数字化转型提供更强大的助力。同时随着金融机构加速拥抱人工智能,云原生融合AI原生,具备云智一体、领先一步的可能。
云原生在金融行业实践中的挑战仍然很多,关于数据治理、资源管理等课题的研究尚待进一步展开。百度智能云将坚持科技赋能的定位,与金融机构、伙伴共同推进云原生、AI原生的落地实践。
(栏目编辑:张丽霞)
往期精选:
(点击查看精彩内容)
● 案例丨华夏银行落地端到端NVMe,全面支撑数字化转型应用创新
● 案例 | 应“云”而生,赋能未来——平安银行 A+ 新核心的自主化建设之路
● 案例 | 凡泰极客 FinClip 小程序平台重塑银行线上业务发展新模式
新媒体中心:主任 / 邝源 编辑 / 傅甜甜 张珺 邰思琪