“新建系统100%上云,存量IT系统将在三年内全部上云。”2020年11月8日,时任中国电信党组副书记邵广禄(现任中国电信总经理)在中国电信天翼智能生态博览会天翼云论坛演讲时宣布,云计算服务将打造为中国电信的主业。
彼时,在场的观众并没有意识到,这可能是中国电信“腾云”的开端。
2020年,中国电信启动云改工程和数字化转型,成为国内第一个推进“云网融合”战略的电信运营商,并推动全集团IT系统100%上云。如今,两年过去,5月17日世界电信日,中国电信宣布,提前完成“云端电信”IT系统的重塑,成为国内第一家100%使用自研数据库、100%IT系统上云的央企,创下全球电信运营商IT系统向云端“迁徙”的最快纪录。与此同时,中国电信的业务平台(OT)上云已马不停蹄地展开,预计在三年内完成。
这是一条在荒野中踏着荆棘前行的开拓之路。
6:3000,中国电信云网运营部平台云化推进处处长陈靖翔第一次接到任务时,在纸上写下了两个数字,6代表平台云化推进处的员工数量,3000代表要上云的IT系统数量。简单计算便可知,平均一个人三年要负责组织约500套系统上云。
这是一条斩断所有“旧连接”的云端重塑之路。
十亿用户、百亿查询、千亿话单背后,是固定电话到云网融合的数十年网络演进,是典型业务要穿透数十个系统的指令,是设备间错综复杂、盘根错节的物理耦合。如今,陈靖翔他们要在云端无缝重建一片更加开放、共享、敏捷的“IT土壤”,却不能在新旧世界的转换时,出一丝差错。
2020年7月,站在起点,陈靖翔抬眼望去,终点似遥不可及。
2022年7月,站在终点,陈靖翔回望来路,原来已跨越千山万水。
上云并非一件新鲜事。
事实上,自谷歌前CEO埃里克·施密特在2006年提出云计算概念之后,经过十几年发展,向云端迁移成为不少企业对于未来发展的共识。但在早期,大多企业的上云之路都始于单系统,核心系统上云是管理者不敢轻易尝试的改革。时间来到2017年,时任中国电信企业信息化事业部副总经理胡志强(现任天翼云科技公司总经理)带领300人的研发队伍,完成了分布式数据库TeleDB、分布式消息等研发,实现了每一行代码的自主可控。2017年11月,中国电信IT架构互联网化福建试点项目BSS3.0(业务支撑系统)成功上线并稳定运行。福建试点的成功,只是万里长征第一步。2018年,中国电信召开信息化年度工作会,宣布启动新一代BSS 3.0推广规划,提出BSS云化要在全国推广,计划上云的业务涉及计费和CRM(客户关系管理)两大系统,包含充值中心、帐务中心、客户中心、受理中心在内的核心业务,承载着十亿级用户、百亿级查询和千亿级话单。然而,会议却结束于不停争执中。陈靖翔回忆,“大家对在核心系统推广互联网架构都比较担心,反复讨论自研数据库TeleDB行不行,稳不稳”。“这事必须做,但若上线后出现大规模故障,我和你一起辞职!”2018年3月,当陈靖翔走进信息化部总经理冯杰办公室时,一张军令状摆在了眼前。曾经,中国电信的IT系统都是属地化“IOE”架构的“烟囱”系统,主要靠商业数据库和小型机承载,出了故障有原厂兜底。如今,中国电信决定大规模改用自研PaaS(平台即服务)组件,这在全球电信运营商中都是首创,一旦发生故障,将是一场灾难,更何况,自有人员的PaaS组件自主维护力量和技能几乎为零。“这是一个不可能完成的任务,却是一项只能成功,不能失败的任务。”听到辞职二字有点懵的陈靖翔想着,“我不害怕辞职,却害怕任务失败对中国电信技术改革带来不利影响”。在人力资源部的支持下,陈靖翔迅速组建了全集团PaaS人才工作站,发布了含统一PaaS清单、参数配置等8类36册70万字的系列规范,从无到有初步建立PaaS集约运营体系。PaaS组件维护的难点是参数配置与调优,有了这些规范,各省公司只需对照配置,专家可以远程检查参数。每个省公司系统割接前,项目组不仅安排专家到现场帮扶,还预备了多种应急方案。
2018年12月,12个首批推广省份BSS3.0分布式架构上线,系统运行稳定,性能和客户体验得到质的飞跃,业务办理时长减少57%,查询性能提升3 倍,计费性能提升10倍,月末月初高峰期卡单堵单顽疾得以解决……BSS3.0分布式架构的成功上线与稳定运行,坚定了中国电信自主研发和自主运维的信心。但严格意义上,此次上云仍属于“手工活”,工作量大、效率低、难度大。陈靖翔知道,这只是开始,不是结束。2020年,国资委印发《关于加快推进国有企业数字化转型工作的通知》,明确要求利用云计算等新一代信息技术,建设敏捷高效可复用的新一代数字技术基础设施,加快企业上云步伐。2020年7月,中国电信率先启动“IT上云三年计划”——新建IT系统100%上云,存量系统三年上云。央企提出整体规模上云,中国电信是第一家,是那匹要过河的“小马”。陈靖翔对此并不意外。2019年底,中国电信整合网络运行维护事业部、企业信息化事业部,设立云网运营部(大数据和AI中心),原本在企业信息化部负责IT运维管理的陈靖翔,被任命为新部门中平台云化推进处处长。这是一个反复斟酌讨论后才确定的处室名称,从成立那天起,其任务正如其名:接应中国电信云改数转战略,负责电信上云专项推进。加上陈靖翔,平台云化推进处一共有6个人,而整个中国电信的IT系统数量在3500套左右,根据规划,中国电信要按照40%、85%、100%的节奏,在三年内完成。上云是一个系统工程,需要统筹考虑六个方面,包括天翼云IaaS和PaaS能力、统一技术底座能力、上云人才培养、合作伙伴上云技能、上云方法路径、上云运维能力和系列运维规范体系,沟通范围涉全网31省分公司、15个专业公司、5家研发单位、200多家合作伙伴,工作常常需要跨公司多个部门,如人力部(人才培养)、财务部(成本配置)、云网发展部(研发资源配置)、云公司、研究院、电信学院等等。
“困难?太多了,两年中发生了太多太多事,每天累到眼睛眯成一条缝。”陈靖翔记不清曾度过多少个不眠之夜,但她庆幸,自己是和一支“集团军”并肩作战。两年来,微信群“中国电信IT全面上云”里的人数,从一开始的6人,不断增长,最终固定在280人。这280个接口人,每个接口人后面还有上百个人,累计有上万的集团军作战。
“这远不是全部,光天翼云公司投入的研发团队便有数百人,研究院、云网运营部的自研团队也有上百人。”平台云化推进处拉起一支虚拟研发团队:陈靖翔这边负责总体规划设计、布道和产品能力迭代,研发分散在不同专业公司,实施和产品经理则是全国各省分公司的条线专家。
一次次“硬仗”印证,在这场不见硝烟的战场上,“电信铁军”永远不会让你失望。
2021年8月,项目遭遇前所未有的危机。
时年,缺芯潮席卷全球,有研究机构预测,当年全球服务器出货量约1700万台,增速仅为个位数,与此相对应的是,疫情带动云端、家庭办公和线上服务需求,大型云端企业对服务器采购强劲。“地主家也没有余粮了”,因为缺少IaaS货源,陈靖翔的进度条在45%,停滞了8个月,而根据计划,年底前要完成85%。上云率半年仅仅提升了3个点;8月天翼云IaaS迟迟未到货;年底完成85%上云的目标无望……是进是退?多家单位纷纷打来电话,想放弃IT上云,转向全面支持外部客户IT上云,不仅能体现自有上云人员的价值,还能拉动企业收入增长。“巧妇难为无米之炊,当时感觉只能听天由命了。”此时,百般无助的陈靖翔并没有想到,一片塞北林海将“治愈”自己的焦虑、绝望和放弃。从北京沿高速往西北方向行驶450公里,便是被誉为“塞北绿色明珠”的塞罕坝,从茫茫荒漠到世界最大的115万亩人工林,59年间,三代塞罕坝人在这里创造了人间奇迹。一次会议上,邵广禄向大家讲述了塞罕坝的故事,“IT上云的确遇到了困难,但我们要学习塞罕坝人,坚持到底,将这个坎迈过去!”
时任云网运营部总经理的刘志勇将这句话和塞罕坝的故事带给了陈靖翔,并激励她,“大家一起打一场‘百日上云攻坚战’”。作战图挂起来,青年先锋队拉起来,责任状签起来,全网数十家单位和200多家合作伙伴,一起喊着“号子”向前冲。最难解决的自然还是资源。全网缺货,服务器是典型的卖方市场,客户们个个派出精兵强将坐镇供应商工厂,“电信集团军”也不甘示弱,采购部、天翼云公司的同事天天拜访供应商,随时准备“抢”第一手货源。按照常规交付流程,即使抢到设备,往往上云实施还要几个月,但攻坚队精简流程、改造好应用、问题日清日结……提前做好一切准备,设备一到立即上云,所有过程无缝连接。31省公司陆续传来好消息,甘肃、湖北、陕西率先完成85%上云,随后是北京、福建、河南、广东、江西、四川、新疆、内蒙、安徽、山东……2021年11月18日,全网提前42天完成85%的年度目标。2021年12月20日,确认了行销宝等系统上云后,陈靖翔更新了挂图作战的进度表,上云率停在了95%,全网上云攻坚团队以超出任务的10个百分点,创造了90天上云1300套的“电信塞罕坝奇迹”。2022年5月,一切尘埃落定。3000套系统全部上云,中国电信提前一年实现上云计划,成功打造速度最快、规模最大的央企上云案例。数字化转型时代的上云,不同于早些年提到的虚拟化、个别系统上公有云,如今的上云,是在开展数字化平台整体规划的基础上,结合企业的实际情况,进行应用云化解耦、流程重构、数据拉通。尤其像中国电信这样业务线复杂,有着高并发、超级复杂场景的超大型企业,如果想全面、规模上云,必须把一个个“软烟囱”云化解耦,推进应用向云原生演进。效率和安全,一个不能少。在团队内部,大家将上云称为“牛鼻子”。通过这个抓手,上云改变了整个集团公司的IT系统的技术架构、应用架构、开发模式、运维模式、数据治理模式,更重要的是,铸就了全套跨行业通用的数字化能力与底座:一朵云(云网融合、公私专混兼备的天翼分布式云)、一套数据库(十年磨一剑的自研TeleDB数据库)和一条龙(无缝集成的企业级技术底座翼龙)。两年来,基于3000套IT系统全面上云的丰富经验,中国电信形成了一套大型企业规模上云的“五步骤十流程”方法论,涵盖上云规划分析、确定上云模式、技术选型与设计、上云实施和部署、 云上运维与监控五个步骤。前三步主要由上云专家负责,后两步由实施团队依托翼龙技术底座实现,从而帮助企业可以低成本、标准化、自动化、规模化上云,并确保云上应用平稳安全运行。陈靖翔拿出了一串数字:46家单位、1000个二级机构、200+合作伙伴均取得研发效能提升3倍、运营成本下降30%的收益,安全运营由事后变成事前、大数据注智由天到实时;系统总数减少了500套,“更重要的是,培养了100名上云总监、1000名架构师、1万名工程师。”人才,对于转型期的中国电信而言,是最重要的资源。
2021年11月举行的天翼智能生态博览会高峰论坛,中国电信首次宣布了科技创新计划,其中第一阶段目标明确,研发经费投入强度提升到4%以上,研发人员占比超过15%。今年2月,中国电信科创部总经理王桂荣在接受媒体采访时透露,到“十四五”末,研发队伍将从2万人扩至6万人,并形成合理的人才梯队。
两年前,中国电信同步启动了IT上云人才培养项目“腾云计划”,加快内部专业人员能力转型,如今“腾云计划”已经成为上云人才培养的品牌,仅2021年,全集团便有超过2万名员工参加培训,合作伙伴上万名员工通过了上云认证。“以前系统建设,是合作伙伴负责实施,我们在旁边看,现在整套翼龙底座都是自研,反过来,是我们指导合作伙伴如何做架构设计。”陈靖翔觉得,数字化转型的根本就是掌握新一代数字技术的转型人才,而通过上云这个重大工程,人才转型在实干中快速完成,“这是最大的收获”。7月24日落幕的第五届数字中国建设峰会·云生态大会上,中国电信透露了几个重要信息:第一,云网融合进入3.0阶段,正逐步为数字中国建设构筑新型数字基础设施底座;第二,天翼云成为国云底座;第三,发布《企业规模上云白皮书》,共享两年IT规模上云的经验。邵广禄在“全面IT上云 助力央企数字化转型”的主题演讲中表示,中国电信正开展“央企上云专项行动”,将会同云计算研发和运营能力领先的中央企业,共同开展国资央企云的顶层设计,制定相关技术标准和规范,共同推进央企上云。不久前,陈靖翔刚从山东回来,当地一家重型汽车集团选用了天翼云,并采用翼龙底座,试行整体上云。“多年的信息化建设,使80%的传统企业沉淀了数十,甚至上百个应用系统,大家普遍存在资源分散、技术栈不一、性能瓶颈、数据治理难、云厂商构成复杂的状况。”这家汽车集团的诸多问题,陈靖翔都似曾相识。这次,陈靖翔是去回访,对方的热情让她有点出乎意料,“他们说,自从使用了翼龙之后,整个企业的通用能力都可以沉淀下来,技术门槛也降低了,100多人的研发团队只需将精力聚焦于产业数字化改造和快速创新,短短1年时间就自研出不少有意思的应用,将直接带动上下游产业链的数字化整体转型”。如此积极反馈所带来的成就感,甚至超过了陈靖翔此前完成100%上云计划时那一瞬间的感动。不久前,邵广禄明确指出,将云计算服务打造为中国电信的新主业,既是企业生存发展的内在需求,也是国家需要。因此,发挥云网融合优势,将中国电信最佳上云经验、能力平台、方法路径分享给同样处于数字化转型过程中的企业,赋能助力各行各业数字化转型,助力数字中国和数字经济建设,是中国电信作为数字经济建设国家队主力军应有的责任,也是中国电信在发展第二增长曲线时的重要实践。2022年的Q1财报显示,今年第一季度,中国电信的产业数字化业务收入达人民币294.14亿元,同比增长23.2%,增速超过其他业务,成为带动公司增长的第二曲线。不过,在已有收入结构中,IaaS(基础设施即服务)依然占比很高,而规模上云最佳实践的输出,在PaaS(平台即服务)层面,将为中国电信带来更大想象空间。
来源:本文转自公众号IT时报(ID: vittimes),点击查看原文。
还不过瘾?XOps 风向标!GOPS 2022 · 上海站正式来袭!GOPS 全球运维大会 2022 · 上海站正在努力进行中,欢迎长按下方二维码,了解更多!
扫码更精彩 ⏬
近期好文:
“高效运维”公众号诚邀广大技术人员投稿
投稿邮箱:jiachen@greatops.net,或添加联系人微信:greatops1118.