查看原文
其他

微信支付架构为什么这么牛?

方秋枋 中生代技术 2022-11-14

微信支付在各个操作系统,各个应用下的挑战还是蛮大的,这也得益于腾讯架构师的专业。


作为一个重要业务,微信支付在客户端上面临着各种问题,其中最核心问题就是分平台实现导致的问题。


iOS 和安卓实现不一致:
  • 容易出 Bug

  • 通过沟通保证不了质量


扩展性差,无法快速响应业务需求:
  • 需求变更迭代周期长

  • 数据上报不全面


质量保障体系不完善:
  • 缺少业务及设计知识沉淀

  • 协议管理松散

  • 缺少统一的自动化测试


用户体验不一致:
  • 比如下图就是之前安卓和 iOS 没有统一前的收银台

为了解决分平台实现这个核心问题,并解决以往的技术债务。我们建立起了一整套基于 C++ 的跨平台框架,并对核心支付流程进行了重构。


微信支付跨平台从 iOS 7.0.4 版本起, 安卓从 7.0.7 版本起全面覆盖。


线上效果指标


以 iOS 上线情况为例:


①Crash 率

上线前后 Crash 率保持平稳,没有影响微信稳定性,跨平台支付无必现 Crash,做到了用户无感知切换。


举个例子,大家可以用微信发一笔红包,拉起的收银台和支付流程就是由基于C++编写的跨平台代码所驱动的。


②效能提升


以核心支付流程代码为例,跨平台需要 3512 行,iOS 原生需要 6328 行。减少了近 45% 的代码。

以新需求开发为例:
  • 7.0.4 版本需求一:收银台改版。

  • 7.0.4 版本需求二:简化版本收银台。


跨平台实现:iOS+安卓共计 3 人日,在封板时间前完成。


原生实现:iOS, 安卓封板时间后一周才基本完成。


跨平台实现:iOS+安卓共计 5 人日,在封板时间前完成。

原生实现:iOS, 安卓封板时间后一周才基本完成。

那么支付跨平台软件架构怎么样有效进行质量保障,并且提升生产力呢?这是这篇文章的主要内容。

什么是软件架构


什么是软件架构?正如 Ivar Jacobson (UML 之父)说过的一样,找五个人来回答这个问题,五个人可能都有各自不同的答案。


架构定义可以有很多种说法,从代码规范到发布流程都可以是架构的一部分。


针对微信支付的业务特点,这里对架构的定义是:架构是系统的组成部件及其之间的相互关系(通讯方式)。


这更符合我们程序员日常编写业务代码时对架构的理解。也就是通俗意义上讲的 MVC,MVVM 等。


为什么需要软件架构


早在 1986 年的时候,人月神话的作者在讨论软件的复杂性时,谈到:软件的本质复杂性存在于复杂的业务需求中。


而管理复杂性,最根本的手段就是职责分离。为了实现职责分离,代码重用,架构慢慢地复现出来。架构的本质是管理复杂性。


没有架构,我们所有的代码都耦合在一起,人类的心智模型不擅长处理这种复杂性,架构的设立,和图书馆的图书分类,公司的组织划分等,本质都是一样的。是为了管理复杂性,以取得更高的生产力。


从 0 到 1 构建支付跨平台软件架构


在移动客户端领域,业界基于 C++ 来编写业务代码,并没有成熟的架构。即使使用 C++ 编写业务逻辑,但都不涉及 UI,不涉及界面的跳转流程。


既然业界没有一个成熟的架构可借鉴,那么是不是直接把业界通用的架构简单套用一下就好?


抽象业务流程


现在业界通用的有 MVC,MVP,MVVM 。这些大家都熟悉的软件架构。但是这些软件架构都存在一个问题: 那就是没有处理好业务流程, 界面转场。


微信支付的流程多。而流程就是由一个个的界面(ViewController,Activity)和相关的业务逻辑组合而成。


上面的 MV(X)模式忽略了一个非常重要的一点,那就是业务流程,界面的转场究竟由谁负责。


也即 ViewController 与 ViewController 之间的关系由谁维护,业务流程的逻辑写在哪里。


如果还按照传统的 MVC 模式,那么 ViewController 自己负责和不同的 ViewController 通讯。


那么 ViewController 得不到复用,更致命的是业务流程的代码非常不清晰,业务流程的代码都被分散到各个 Controller 中, 而一个 Controller 又可能耦合了多个业务的代码。


举个例子:一个普通的转账流程,可能会涉及风控拦截,实名验证, 收银台, 绑卡,支付成功页等等。


如果是基于 MVC 这种架构的话,很快代码会变得难以维护。

因此,为了适应微信支付流程多,界面跳转复杂的特点。架构抽象的第一步就是将业务流程抽象为一个独立的角色 UseCase。


同时, 把界面抽象为 UIPage。 一个大的业务流程可以分解为一个个小的业务流程。

和刚才基于 MVC 混乱的架构相比:

  • 业务流程的代码能够聚合到 UseCase 中,而不是分散到原来 iOS,安卓的各个 ViewController,Activity 中。

  • 业务流程和界面得到了复用。

  • 契合微信支付多流程,界面跳转复杂的业务特点。


加入路由机制


既然流程得到了抽象,这个时候需要针对业务流程做更深的思考。在开发支付业务流程时,开发者不可绕过的问题有:


①流程之间,页面之间的流传

比如我们要给一个朋友转账,输入金额,确认支付,触发 CGI 后。下一个流程是多变的。


有可能用户需要去实名,有可能用户要进入一个安全拦截的 WebView,或者是正常拉起收银台。


本文中的名词 CGI 可以理解为一个网络请求,类似HTTP请求。


那么以往在 iOS,安卓分开实现时,都没有一个统一的处理机制。要么就是通过网络回包的某个字段来判断,要么就是本地维护一些状态来决定下一步走什么流程等等。非常繁琐,易错。


②特殊流程的处理

支付业务流程还有个特殊的地方,那就是在正常流程的中间,往往很多时候要需要插入一些特殊流程。

比如有些地方要跳转 WebView,有些地方要跳转小程序,有些地方要弹窗告知用户风险,或者终止当前流程,等等。我们经常需要在业务代码里面不断重复增加这样的处理。


这些问题,引导我想到,微信支付需要一个路由机制。首先了解一下路由机制。

路由机制的核心思想,就是通过向路由传递数据,然后路由解析数据,并响应。

结合微信支付和网络密切相关的特点。创新地将支付领域模型作为传递的数据。

那么怎么建立这个支付领域模型的呢?建模,就是建立映射。领域知识+建模方法=领域建模。那么这里的领域知识,就是对支付业务流程的理解。


建模方法,我采用了 UML 建模。最终会落地为 Proto 协议供客户端和后台一起使用。

首先,微信支付业务特点就是和网络密切相关,流程和页面往往是由 CGI 串联起来。


因此建立模型时,最外层便是网络回包。对于路由机制,这里我们只关心路由数据模型。


路由数据模型由路由类型,还有各个路由类型所需要的信息组合成。路由类型清晰的定义了要触发的行为。


究竟是要开启一个 UseCase,还是要打开一个界面,或者 网页,小程序,弹窗等等。


然后就是这些行为所需要的数据。比如打开小程序所需要的参数,弹窗所需要的参数等。

建立支付领域模型后,我们路由的解析就变得非常清晰了。路由解析之后,会根据路由类型,触发不同的动作。


比如流程,界面流转,会交给 UseCase 处理。而特殊流程,比如打开小程序,打开 WebView,弹窗这些行为会统一进行处理。


我们在第一步把业务流程抽象为 UseCase。第二步则加入了路由机制。加入路由机制后,支付跨平台的软件架构演进为这个样子。

加入路由机制后,对比 iOS,安卓原来的旧架构:

  • 统一了流程,页面的流转。清晰,易维护。

  • 统一了特殊流程的处理,减少重复工作。

  • 在加入路由机制的时候,结合微信支付和网络密切相关的特点进行了支付领域建模。支付后台协议重构 2.0 的核心思想也是围绕着这个路由机制展开。

再来看一下,加入路由机制后,对生产力的提升。以支付流程打开 WebView, 小程序为例,减少将近 83% 的代码。


更重要的是,这里的特殊流程,是在路由机制里面统一处理的,没有耦合到业务代码中,并且是可复用的。


管理网络请求


首先看看原来 iOS 处理支付网络请求的缺陷:

原来支付的请求,都是通过一个单例网络中心去发起请求,然后收到回包后,通过抛通知,或者调用闭包的方式回调给业务侧。


会存在这样的问题:


①CGI 一对多通讯问题

举个之前遇到的问题:


那么钱包发起的 CGI 的回包就会覆盖收付款页面的数据。之前在 iOS 只能通过修修补补,增加场景值,增加些标记位来解决。

可能某一天就会又出现新的坑。进入钱包页面后,发起了一个 CGI,然后进入收付款页面也发起同一个 CGI。


如果收付款发起的回包先到,然后钱包首页的回包再到。


②CGI 生命周期问题

不时会有用户反馈一下,怎么没有做什么操作,突然就会弹出网络报错。原因就是 CGI 的生命周期有问题,在业务结束后,CGI 的回包仍然得到了处理。


解决方案如下:


①将 CGI 抽象为独立对象


在架构设计上来说,旧架构是通过单例模式实现的集约型 API,而我们新的架构则是通过命令模式实现的离散型 API。


也就是将 CGI 封装为独立对象。我们把 CGI 相关属性和能力内聚起来。开发业务时,只需简单继承 BaseCgi,设置一下参数即可。

②划分职责,明确生命周期


关于 CGI 由谁发起,之前安卓和 iOS 都没有一个统一的做法。有些人会放到 Activity,ViewController,和 UI 代码耦合起来。

因此,在跨平台软件架构中,我们统一由业务流程 UseCase 进行发起。并且生命周期是一对一的,一个 CGI 只会有一个 UseCase 处理, UseCase 销毁后,CGI也随之销毁。

对比旧架构:

  • 杜绝了一对多通信造成的 Bug。

  • 生命周期和业务逻辑绑定,不会出现业务结束,CGI 回来后再触发动作。

  • 高内聚,低耦合。将 CGI 相关的数据,能力集中处理,业务侧无需感知。

  • 提供统一的缓存,加密能力。
第一步和第二步,我们抽象了业务流程,加入了路由机制。

在第三步管理网络请求后,我们的软件架构演进为这样子:

规范数据传递


iOS 和安卓的旧架构都存在信息传递不当和数据污染问题。这个问题最严重。iOS 和 安卓都出过不少 Bug。


首先我们来看看最近现网出现过的问题:之前 iOS 出现,不少内部同事,外部的用户都在反馈:进行零钱页后,会无故弹空白框。而支付又和金钱有关,引起用户的恐慌。

具体原因就是:

  • 进入支付首页时,后台返回了数据,然后被写入到一个公共的 Model。

  • 然后进入钱包页,再进入零钱页。这个公共 Model 一路被传递过去。

  • 然后零钱页读取了公共 Model 的数据,但是代码无法处理,导致出现了这个让用户恐慌的问题。


除此之外,之前还有有很多发生在安卓,iOS ,像钱包页零钱展示错误。付款的时候银行卡失效等等问题。


这些问题五花八门,看起来发生的地方,场景都不一样。每次遇到这类问题的时候,就只能去修修补补。


但是深究下去,会发现真正的原因,是软件架构上存在的问题:

支付旧的架构采用了黑板模式,虽然方便了数据读写。但是带来的问题和收益完全不成正比:

  • 存在公共读写的数据类型。安卓传递的数据类型是一个字典,而 iOS 则是一个 Model 对象。所有的界面,业务逻辑都共用一个数据。

  • 无序的数据流动。数据的流动是不可追溯的,数据的修改可以发生在任意使用公共数据的地方。

那么支付跨平台软件架构,为了杜绝这样的问题我是这么做的:

  • 去掉公共读写的数据类型。

  • 传递值类型(Value Type)的数据, 后面流程修改数据时,不影响前面的流程。

  • 单向传递数据,只依赖注入必要数据。

  • 如果数据修改需要通知前序流程,使用代理模式通讯。


规范数据传递后,对比旧架构:

  • 从架构上根本解决了困扰微信支付已久的数据污染的问题。

  • 数据的流动变为单向,数据流动变得可追溯。


前面三步,我们抽象了业务流程,加入了路由机制,统一管理网络请求。
那么规范数据传递后,我们软件架构就演进为这样子:

总结


软件的本质复杂性存在于复杂的业务需求中。而软件架构的本质就是管理复杂性,因此真正的好的架构,正是在复杂的业务需求中反复提炼和总结归纳而来,解决了真正的业务问题,不是空谈。


软件架构除了清理历史旧架构的缺陷,是我们业务开发的基石之外。还能够赋能业务,为业务带来价值。


在建立软件架构的基础上,还围绕着软件架构建立起微信支付的跨平台自动化数据上报机制,防重复支付,安全横切等带来巨大业务收益的能力。有机会的话,后面也会进一步编写相关文章和大家交流探讨。


架构是一个不断演进的过程,随着新的支付业务基于跨平台软件架构的不断编写, 我也会对这个架构进行持续的更新迭代。让这个软件架构更贴合微信支付,更加健壮和完整。


作者:方秋枋

编辑:陶家龙

出处:《基于 C++ 构建微信客户端跨平台开发框架》


往期推荐

设计抗100亿请求的春晚红包系统

DDD权限平台建模与实战(附代码)

从西安一码通崩溃,看千万级DAU系统该如何设计

异地多活实践与设计思考点归纳

技术经理:别当超级英雄!

天画-codeMaker组件化架构升级实践

干掉visio,这个画图神器真的绝了!!!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存