专访阿里视频云叔度:一场技术人的自我修行
云栖君导读:从甘肃瓜州广显驿到新疆哈密小南湖佛寺,这段全长超过400KM的戈壁是唐代玄奘大师西行取经过程中最为凶险的路段。1300多年前,玄奘大师孤身一人,历经九死一生的重重挑战,最终成就了千古伟绩,受万世景仰。千年之后的2018年,“玄奘之路”BC连14位同伴在这段自我修行的路程中沿着大师昔日的足迹徒步前行,对极致的追求促使他们努力挑战生命的每个不可能。
其中,最让人感动的是一个打着点滴行进的身影,他在遭遇右腿受伤、电解质紊乱导致胃痉挛、能量耗尽等极限状况下仍坚持走完了最后的50公里。他就是阿里云的叔度,也是本文的采访主角。
打着点滴穿越戈壁的叔度
朱照远,花名叔度,阿里视频云总经理,现负责阿里云CDN、视频云、边缘计算等产品的业务和技术。他是开源Web服务器项目Tengine的发起人,研究方向包括高性能服务器开发、大型网站的架构和性能优化、云计算技术等领域。
一、从翩翩少年到技术大牛的进阶
2000年9月,叔度在千禧之年从湖南大学开始了他的IT之旅。
他是个技术控,作为计算机科学与技术专业的学生,他的电脑是自己亲手攒的,CPU、主板、内存、硬盘、网卡、显示器的选购以及后续的组装,全部都是自己一个人搞定。然而尽管生活有点拮据,他却在大学时代买了几千块钱计算机和编程相关的书籍。
“因为当时对写程序入了迷,上课教材里的内容和实际中脱节比较严重,所以就自学研究写程序,一下子就扎进去了”,叔度笑道,他的动手能力已经超过了绝大部分的同学。
但叔度并不是一个学霸,他甚至笑称自己是学渣,大学期间花在寝室里写代码的时间远远多于去教室上课的时间。
从大一开始,这位翩翩少年就在一家电脑公司实习,一方面为了补贴自己赚点生活费,另一方面也是因为他对老师较为死板的教学方法不太感冒,想通过实践获得更多的计算机知识,增加自己的的编程经验。
“当时我在深圳的一家网络安全公司实习时,就帮助他们实现了一个他们好久没有搞定的代码功能。”叔度回忆道,这个经历让自己获得了很大的成就感。尽管每个月“只有”600块的薪水,但学生时代的他对计算机硬件和软件的热爱就是从这里开始的。
大四上学期,叔度获得了他向往已久的金山软件发出的第一份正式工作offer。在那个年代,金山是国内明星程序员的集结地,求伯君、雷军等都是这家公司的一员。在金山,他参与到了WPS Office的开发中。
“七牛CEO许式伟当时是WPS的架构师,而我做WPS也有将近四年的时间,现在的WPS里应该还有我写的代码。”叔度如此谈到。
大学四年里,叔度还对Linux、网络等方向产生了极大的兴趣,这一爱好在一定程度上影响了他的职业生涯。
“我很喜欢在Linux上写高性能服务器程序,当时有个C10K问题非常有挑战,也很有吸引力。但在金山的时候我天天做的是在Windows上写桌面的程序,所以我一直盼望能做网络服务器”,也是出于这个原因,2008年的时候他去了另一家创业公司做游戏网关相关的工作。
有趣的是,在这家公司,叔度结识了现阿里云弹性计算的负责人褚霸。之后的事大家都知道了,叔度在2009年入职阿里,2010年,在他的引荐下,两人在阿里再次相聚。
“为什么会选择加入阿里?”面对这个问题,叔度耸了耸肩说,在创业公司做底层技术犹如大炮打蚊子,因为业务量太小根本不需要很强的技术来支撑,对于渴望技术挑战的叔度来说,显然无法发挥出他的价值。
俗话说酒香不怕巷子深,叔度在HTTP服务器、开源软件上的技术沉淀很快让他在这个垂直的圈子里脱颖而出。他曾写了一份分析开源软件NGINX源代码的英文文档,被朱鸿(花名一粟,现任钉钉CTO)发现了,于是把他推荐给了当时淘宝核心系统部的负责人,也就是开源技术的大牛、LVS作者章文嵩博士。
“之前整个公司的服务器不到20台,最高在线人数也只有两千到三千左右”,而当时的淘宝已经有超过15000台机器,这在当时是一个天文数字。叔度不可谓不心动,还未面试他就已经开始憧憬在一万多台机器下探索的画面。
加入阿里初期,叔度主要从事Web服务器的研发工作。这个时期的淘宝,甚至是整个阿里,都处于技术变革的重要阶段,而这一批被招进来的人也随着淘宝每年双十一突飞猛进的业务,推动着技术和系统不断演进,因为只有不断的演进甚至是革新才能满足业务的飞速发展。
二、见证阿里巴巴四代CDN架构演进,他拥抱开源之路
2009年,Apache是业内主流的Web服务器,但是因为它架构落后,导致性能不高、占用资源较多。淘宝网在使用Apache的过程中也碰到了很多问题,为了解决这些问题,叔度只身推动了从Apache到NGINX的切换。
直至今日,叔度依旧对这段时光记忆犹新。
“当时那个工作量是非常大的,第一个切换的应用是在CDN上,仅仅配置文件就有几千行,需要一个个写测试案例然后上线,因为正在服务的生产系统上是不能出问题的,犹如在飞驰的汽车上换轮子。除了不同的配置要转换,原来没有的功能也要先实现、再替换。”
上线后,系统负载降低效果立竿见影,有效解决了因为软件本身性能导致的稳定性问题,于是他着手把整个淘宝的Web服务器系统替换成更高性能的NGINX。尽管困难重重,但新上线的Web服务器除了性能更高,也有很强的定制潜力。很快,叔度开始带领团队基于NGINX开发了淘宝的分支版本Tengine,在内核上进行了深度定制,实现了诸如动态模块加载、流式上传等高级功能,根据阿里的业务需求进行了大量增强。**2011年,淘宝把Tengine开源,贡献给了整个社区。**
因为工作上的突出表现,叔度顺理成章成为了淘宝CDN的负责人。不久后的2013年,整个淘宝CDN团队整合进阿里云,阿里云CDN应运而生。从服务集团到商业化输出服务,叔度带领团队迅速前行。
尽管淘宝以及阿里巴巴集团其他业务的体量已经足够大,但显然,服务海量阿里云客户对技术和稳定性的挑战更大。在这样的压力下,叔度保持了一贯的从容。
事实上,早在淘宝CDN期间,团队就曾赢得2011年的淘宝创新大奖,当时的淘宝CDN架构,已经处于国内领先。
“我们首先需要针对外部更多的场景去把系统的稳定性、安全问题都给解决掉。”这种从慢慢积累到产品成熟,稳定性是系统最为重要的事情之一,因为稳定才是系统的基本。同时,海量用户带来的数量级规模提升,对系统的性能和自动化也要求极高。
从完善技术到精益求精,叔度亲历了阿里CDN六代架构的演进。
“从购买商业设备、到使用开源软件、开源软件改造、再到自己编写核心软件,底层架构一直在升级。”
目前阿里云CDN架构已经实现了对开源的深度改造和核心定制,还有核心软件的自研,“我们在这一领域的性能是目前世界上领先的。”叔度自信地说道。
自研不代表不开源,叔度表示,“本质上,我们也是开源软件的受益者,所以也在把自己做的代码开源贡献出来。”
在此之前,国际上对中国IT界的评价就是开源黑洞——只有拿来主义,没有反馈和贡献。而叔度对开源的执着由来已久,他是阿里巴巴开源委员会的几个核心成员之一。从2010年淘宝开源KV数据库Tair开始,阿里对开源投入了很大的力量,众多优秀的开源软件如雨后春笋般出现,这其中也包括部分阿里云CDN所使用的软件的代码。
根据GitHub 2017年的数据显示,阿里巴巴是对开源社区贡献最大的中国公司。
三、拒绝随波逐流,他引领CDN行业变革
让叔度名声大噪的是,几次释放CDN技术红利带来的低成本效应。整个CDN行业伴随着这几轮降价在潜移默化中发生了巨变:传统CDN行业一片哀嚎,而云CDN开始大行其道。
“我们希望让整个行业进入一个越来越合理的状态。”传统CDN公司之前只是买入带宽,再高价卖出去,暴利之下,他们没有动力去探索技术的创新。
对于客户而言,云CDN和传统CDN更是有本质上的区别。叔度举例说,某个客户想要更改域名的配置:传统CDN下需要通过邮件讲清诉求,然后转到厂商手上再操作,一般情况下需要48小时生效;而云CDN则是自己通过平台操作,几秒即可全网、全球生效——这就是服务模式的变化,其中对技术的挑战是非常大的。要让海量的用户在云CDN上配置海量域名,秒级生效,同时对应的数据如监控等也要秒级看到,不仅要求灵活性大大提高,弹性也要实现提高,这个就是云计算从模式上带来的变化。
此前,CDN被公认为是暴利行业,尽管客户怨声载道,但市场迟迟未能迎来变革。直到阿里云CDN引领行业的几次降价,市场才悄然发生了变化,CDN的带宽成本急剧下降。以视频直播为例:过去,无论是视频点播还是直播网站,公司运营费用里面的40%以上都花在带宽上;而云CDN的加入,不仅让整个公司的运营成本大幅降低,也能很好地促进整个行业的发展。
四、他将带着国内顶尖的CDN团队走向何方?
谈到未来,叔度说道:“未来的行业红利则会集中在技术创新带来的增值功能上。”前期的竞争主要围绕缓存,后期则会更加注重增值的功能,包括视频、边缘计算等。
如果你认为边缘计算只是IoT领域的概念,就稍显片面了。叔度通俗地解释道,“边缘计算的英文是Edge Computing,而CDN服务器的英文名则是Edge Server——本身都是边缘的意思。”他认为在CDN既有基础设施之上,在上面服务边缘计算一些场景是非常适合的。换言之,现在的云计算主要还是以数据中心为主,但将来的边缘计算则会遍布到用户的场景里面,更加靠近用户场景,在大带宽、低时延方面都会表现得更好。就在本次采访之前,阿里云的边缘节点服务已经上线,
在今年上半年的CDN亚太峰会上,叔度还提出了“视频智能”、“无处不在”和“超高清”三大行业趋势。他认为引入AI是人类对视频处理更高的一个层面,边缘计算将让CDN服务能力无处不在。
而在“超高清”这个领域,叔度带领的团队已经推出了全球首个8K视频云解决方案,8K视频每一帧的图像清晰度已经超过了普通单反相片的清晰度。
“我们想通过8K视频云方案,为人们实现最高的清晰度。虽然目前并没有大量客户真正用到,但是我们认为它会让人们对于清晰度的追求更上一个层次,这就是做8K的意义,这就是未来。”
而更深层的意义是推动产业链的发展,从拍摄设备厂商、编解码厂商,到运营商、显示器厂商,再到播放器厂商等等,会形成一个真正的云厂商联盟,并最终实现商业化和产业化,给观众带来更好的视觉体验。
在刚刚结束的2018俄罗斯世界杯中,叔度的团队又一次谱写了行业的历史。阿里视频云团队,护航了全网70%的世界杯直播流量。为优酷, CCTV5等客户提供了全栈式的技术保障。
在这次世界杯中应用的CDN、视频AI、窄带高清2.0™等技术,都是在阿里经过大规模验证的产品技术。经过这次练兵,团队的硬实力和作战经验都又上了一个台阶。叔度骄傲的说:“我们是国内唯一一家支撑所有世界杯直播客户的云计算公司,拥有丰富的大型直播护航经验。”
他也认为,正是这一次次的流量洪峰,不断推进着阿里云,走向更加稳定、流畅、极致的产品之路。
后记
在徒步穿越茫茫戈壁的路途中,叔度接受了组委会的采访,视频中他面色憔悴,身体严重脱水,放弃还是坚持只在一念之间,但叔度心无所惧坚持前行,才有了这段技术人的“八百里流沙”修行之路。
end
阿里巴巴中间件硅谷 Istio 专家解读Istio 1.0 发布
更多精彩