查看原文
其他

移动支付背后的高可用架构设计

2016-07-08 陈斌 QCon

易宝集团CTO陈斌,在QCon北京2016上分享了《移动支付背后的高可用架构》,通过这个演讲,我们可以了解到:


  1. 复杂移动互联网系统服务的容错架构设计;

  2. 大型移动互联网平台的可扩展性架构设计;

  3. 移动互联网架构设计的经验。


https://v.qq.com/txp/iframe/player.html?vid=e0311obncj6&width=500&height=375&auto=0


在移动互联网飞速发展的今天,移动互联网系统面临着高可用性和高度可扩展的挑战,如何设计一个这样的系统架构是一门艺术。


解决高可用性问题的关键是如何合理地细分系统的服务,并对其运行环境进行有效的隔离,确保一个服务的失效不会影响到生产系统中其他正在运行的的服务。这类似在奥林匹克游泳馆里设置的泳道,通过一个个的浮标连线,确保一个选手游泳时飞溅的水花不影响临近的其他选手的高水平发挥。


与此同时,为海量用户提供满意的支付交易服务,需要解决系统的可扩展性问题。这不仅仅是简单地添加机器、扩大存储、增加带宽(X 轴扩展)所能完成的,更需要在架构设计的过程中,通过对服务的合理组合和拆分(Y 轴),以及对用户/地域的有效分组(Z 轴)来实现无障碍的系统能力扩展。


作者介绍


陈斌,易宝集团 CTO。


1999 年投身于硅谷互联网技术发展的浪潮,参与硅谷互联网公司的创业,曾任日立美国系统集成总监,Abacus 首席架构师,Nokia 美国首席工程师;


2008-2013 年在 eBay / PayPal 任资深架构师,负责移动应用系统的架构设计。丰富的海外经历,多年的架构经验,深谙移动互联网对传统行业的影响;


2014 年投身易宝集团,领导集团技术团队,建设易宝集团的技术体系,提出了大、平、移、商的战略方针,他是最前沿技术的实践者和布道者,全力推动移动互联网技术引领行业变革。


幻灯片


在公众号后台回复“高可用”,即可下载幻灯片。



QCon 上海 2016 将于10月20~22日在上海宝华万豪酒店举行。


Spotify 架构师 Igor Maravić,届时将分享《Spotify 高度可靠的事件交付系统是如何设计与运维的》


Spotify 的事件交付系统是 Spotify 数据基础设施的核心要素之一。该系统的一个关键需求是,应该在可预测的延迟下可靠完整地交付数据,供开发人员通过定义好的接口获取。交付的数据用于支持 Discover Weekly、Fresh Finds 和 Spotify Party 等产品功能。


目前,该系统每秒会交付 100 万事件。为实现系统的无缝伸缩,它被设计为一组微服务。系统使用 Google Cloud Pub/Sub 在 Spotify 的数据中心之间转移海量数据。


本次演讲将分享 Spotify 高度可靠的事件交付系统的设计与运维细节。


阿里巴巴技术专家陆传胜,将分享《携程的推荐及智能化算法及架构体系实践》。


Java 应用热更新技术是很多容器(如 tomcat)很早就实现的功能,但是由于天生的一些缺陷,比如无法精确控制和干净回收 cpu、内存等资源,一直没有在生产环境中的大规模部署应用。对生产环境中的应用系统升级,大部分项目会采用保守的“重启”方式操作每个节点,使得新版本的 Java 进程或容器运行在一个“干净”的环境中。但是对于拥有海量节点的大规模 Java 应用,为了在升级过程中不间断提供服务、不造成请求数和响应时间的波动,一般需要分较小的批次进行发布和重启,大量持续的重启操作使得发布这一操作成为一个整体上非常耗时的过程。


本次分享将介绍阿里开发上线的一种动态更新大规模 Java 应用的方案,通过在 Java 虚拟机层面加入虚拟化的支持,能有效解决传统热更新方案的痛点,高效精确的回收系统资源。对于大规模 Java 应用,可以做到不重启 Java 进程而达到更新应用的目的,整体更新操作时间也被大大缩短。


英特尔资深架构师叶军,将分享《深度学习框架的性能优化及其在医药行业的应用实践》。


开源界大致有 5 个比较流行的机器学习框架,在本次演讲中叶军会对它们进行简要介绍与对比分析。目前这些框架有一个共同的问题那就是只对 GPGPU 平台有较好的支持,在其它平台上(例如 CPU)性能非常差。我们知道机器学习是个很大的概念里面包含很多不同类型的算法模型,而这些模型在不同的平台上会出现不同的性能瓶颈,如何能让这些框架很好地支持多种主流平台以便为不同算法选择提供最佳的运行平台是业界面临的一个问题。


在演讲中叶军会探讨针对这个问题的一些解决方案和案例研究。其中一个典型案例就是我们和日本京都大学合作成功地在 CPU 平台上利用 CPU 的超大内存容量支持解决了药物开发深度学习模型在 GPGPU 平台上出现的瓶颈,大大提高了所能支持的数据集大小以提高训练精度,而且不需要对用户代码做修改。


Twitter 架构师黄浩,南潮(ruff.io)架构师周爱民,宅米 CTO 李智慧,京东云平台资深架构师鲍永成,OneAPM 安全技术总监刘再耀,点融网 CTO 孔令欣,饿了么前端工程师陈涌(题叶)等技术专家都将在 QCon 上海 2016 做分享,更多信息,可点击“阅读原文”,访问大会网站。现在报名,可享 8 折优惠。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存