‘‘微盟式’’SaaS,让商业变得更智慧
在助力企业数字化转型的共同目标下,越来越多的服务商正走向更加紧密的合作。而面对海量数据爆发式的成长,以往单一的SaaS产品很难直接满足企业的业务需求,在某些场景下,无论是性能、安全还是稳定性,都面临着各种各样的问题。
日前,拥有多种企业特性的微盟SaaS工具却屡次获得用户认可,这是怎么做到的?以下将带来微盟余成真先生的分享实录:
微盟做为中国领军企业云端商业及营销解决方案SaaS提供商,现有员工超过1万人,入驻商户超过300多万家,在商业产品这块SaaS类云产品,能够为用户提供精准营销服务。
SaaS是一种全新的通过Internet提供软件服务的模式,主要面向企业级客户。微盟业务特色是营销数字化,通过多样营销插件,赋能企业实现数字化运营 ,让商业变得更智慧。业务多样及复杂性,也使得数据库面临诸多挑战,而微盟很多核心的接口都是毫秒级别的响应,落地到数据库可能就是几毫秒甚至纳秒级别。
稳定、高可用也是DBA提供数据库服务基本能力,高可用依赖于云数据库能力,实现了异地多活、双活的架构,通过对高可用应用厂商调研,包括通过边缘业务实际演练,都证明这种高可用架构是非常成功的。
其次是微盟对数据安全追求,数据安全是微盟极度重视的重点项目之一,我们严格要求对于人员安全、数据库安全进行长期治理。比如说微盟数据库分类分级、线上数据查询精确授权、故障数据库备份场景演练、运维操作风险控制等等,都是属于微盟治理项目的内容。
最后一块海量数据库运维带来的挑战,因为微盟涉及到数据库实例数量多、类型多,业务线多,管理好这些原数据是DBA做好工作的先决条件,也是做好精细化运维的基础数据。有了这些数据,可以将一些数据库使用问题、巡检报告的风险分析,及时传导给业务域,去进行数据治理,降低故障,从而打磨出一个稳定、高可用产品。
比如说腾讯云MySQL的优化,主要通过硬件选型、参数、服务器进行优化,以此达到选型优化目的。同时还有业务SQL优化,前面讲到微盟核心接口都是毫秒级别响应,所以对于业务SQL是要长期治理,微盟也形成了一套自己的SQL优化跟进机制。扩展:并不是说完成所有优化,业务就满足了,高QPS读也是需解决的实际问题,用云原生数据库TDSQL-C来解决读能力扩展问题。众所周知,社区版MySQL对数据延迟不可控,而微盟现在用云原生数据库TDSQL-C解决了延迟不可控的问题。
因为微盟使用了扩展的只读能力,使业务应用只读的场景变得更多,同时提升了资源使用率,这也是一种降本的表现,云原生数据库TDSQL-C在极速扩缩容、海量存储应用上是非常便捷的。
微盟还使用一款产品是TDSQL-H,这种产品可以解决某些业务AP类查询资源使用高的痛点,通过数据传输工具DTS或CDC,将TP与AP场景进行无缝结合,实现全场景使用闭环。
数据库性能优化目标总结起来是三点:降本、增效、达标。通过不断SQL优化,不仅使数据库服务本身更加稳定,也降低资源使用率,能够精确资源配置,达到降配降本目的。在增效这块,微盟对实例进行打标签,根据实例标签属性:重要实例、非重要实例、核心实例、高流量实例等等,为实例扩缩容提供一些依据,也为运维资源分配提供重要理论数据,实现重点资源重点运维,达到运维增效的目的。
前面讲到优化,可能带来最直观效果就是告警数量的减少,告警数量减少意味数据库服务的达标。在优化过程中,微盟也衍生出很多治理方案及项目,比如说做慢SQL的治理,包括去定位DBA跟进人等。
监控和告警治理方面,监控是依赖于腾讯云API接口做本地数据落地,监控治理可对业务域监控数据输出,微盟基于需求监控数据可以动态形成各种各样报表,比如说实例可以基于监控数据进行全资源风险巡检,可以动态多维度查看本地监控数据,去看TOP级QPS、CPU应用实例,达到掌控优化整个集群目的,同时对外我们也可以提供数据监控接口的能力,还能监测云监控本身服务的高可用。
在告警治理这块,微盟将云上告警落到本地,这样可以对业务域进行定向维度告警,同时也可以做基于资源、时间维度、业务维度、告警指标维度的全方向实例分析,最终目的是为服务稳定做保障。这种告警也打通至内部监控系统,比如和cat去做耦合,形成了全链路业务告警联动,可以通过DBA视角去审视业务影响情况。
SRE运维解决方案是建立一套专业、可用的数据库管理平台,这也是各大公司已经完成或者正在做的产品。而微盟这套平台解决的是实例全生命周期管理,还有工单自动化能力,也能提供运维人员对数据库的运营能力。
高可用这一块,依赖于云数据库能力,云数据库消除了自建数据库高可用组件的运维压力。在多可用区建设方面,微盟的DBA角色转换为需求提出者、方案验证者、可用产品的使用者。通过云数据库高可用架构原理推演及线上边缘业务真实故障演练,也证明了多可用区的故障转移能力,同时微盟也在计划进行周期性全实例多活可用性演练。
数据安全是微盟重点关注方向,微盟解决方案是通过定义规范化流程来保证安全,这里列举4个面来阐述微盟规范流程建设:操作SOP流程、应急预案流程、报告总结规范、权限收敛规范。主要是通过抽象DBA日常运维工作事项,来进行流程化、标准化定义。从而使得每种运维操作具有清晰操作步骤、验收流程、回滚方案,能够极大的降低运维人员操作风险、使各方能监控执行的各种状态、能预知操作的风险点,达到保证数据操作安全的目的。
运维安全有两个点做阐述,一是系统风控,二是制度风控。比如说授权机制、权限分类级别、权限控制、账号权限回收、操作流程风控等等,微盟也有一套危机应急预案,在数据的恢复、还原方面;微盟在制度上面也做了很多工作,比如面试流程、人员离职流程,包括在平时工作中也会跟进运维或者DBA人员工作状态,也定期向所有运维人员去做制度法律的宣讲。
最后,聊一下对于云数据库使用的未来畅想。关于TDSQL产品前面介绍了很多,我这里也列了两点,第一点就是并行查询,据我所知,有厂商实现了并且部署在线上使用 ,并行查询理论可以提高百倍查询速度,这对用户来讲吸引力非常大,相信腾讯云厂商也是有能力把这块给到我们的企业用户。
另外一块就是HTAP场景,因为SaaS行业的特殊性,对于AP类查询功能会越来越多,查询时效也会越来越高,而对于AP型数据库的要求,则是希望TDSQL这一系列产品最终实现一体化,让用户能够通过一个简单的配置或者一个简单的购买就能实现HTAP的能力。
﹀
﹀
﹀
亿级月活全民K歌Feed业务在腾讯云MongoDB中的应用及优化实践
腾讯云TDSQL助力金融核心系统数字化转型
TDSQL 在微信支付数据密集型应用落地实践