查看原文
其他

致敬!阿里云的数据库侠客!

电商君 电商报Pro 2022-04-01

作者:电商君

来源:电商报(ID:kandianshang)


王坚随手抽了把单刀


2005年,“成功大师”陈安之在央视《对话》节目中点评马云:“自信不等于自大……以后低调一点,不要太骄傲”。

马云回应称:“我不知道什么是成功,但我知道怎样定义失败……所谓的成功学肯定没什么用”。


这一年,淘宝网两岁了,但是两岁的淘宝网却像误打误撞的郭靖喝了梁子翁的灵蛇仙血,长着一副成人的身躯:当年淘宝的货架上陈列着800万件商品,每天的浏览量超过了9000万次。

所以,马云不但没有听陈安之大师的话保持低调,还决定干一件大事,将平静的电商江湖炸一炸。

这一天,马云和杨致远坐在一起,喝了“有史以来最贵的一杯清酒”,酒喝完了,雅虎中国10亿美元也打到阿里账上了。马云简单扼要地下达了一道命令:将所有10亿美元全都打出去,打到ebay退出中国为止!

此时,在遥远的中国北京,神秘的微软亚洲研究院在月色之下苍凉如水,身处其中的王坚,就像是地球上最后的一个人类,他正在研究的,是同样不可捉摸的 “大数据技术”。
王坚

这年的年底,北京下了一场大雪,侠客王坚随手抽了把单刀,走了趟雪花掩月,无声的月夜,只有鸽子簌簌地飞起 。


这个事对阿里就是个耻辱!


马云对淘宝是有信心的,他太了解中国人了。

而ebay到现在还不明白自己当年在中国失败的原因。中国有句古话:将欲取之,必先予之,淘宝免费入驻、免费宣传的政策一推出,ebay在中国80%左右的市场份额马上像瓦片一样跌落在地,发出轰轰的声音,在马云听来,这是很欢快的声音。

当时,阿里巴巴有三个儿子:老大阿里巴巴网站,老二淘宝,以及,刚出生不久的老三支付宝。

三个儿子,阿里一个都不想亏待,给他们配置了当时全世界公认的最炫酷的装备:甲骨文的数据库、IBM的服务器、EMC的存储,让他们仨成为这条街,这条街,最靓的仔!

但是,国外的最牛装备也有神游太空的时候:2006年,就在IMB最早两台小型机进驻机房后不久,突然宕机了!

40分钟后,IBM 的工程师还在万米高空火速从北京飞到杭州时,小型机自动恢复运转了。

时为阿里工程师的张瑞觉得,这个事对他、对整个阿里巴巴都是个耻辱:阿里花那么多钱买了一堆中国工程师不会修的怪兽机器,这种情况还要持续多久?
张瑞

而且,数据库靠甲骨文,服务器靠IBM,存储靠EMC,那阿里巴巴是什么?


如果现在不做技术研究,

十年后,人们将看不到阿里巴巴!


2009年的某一天,就像一张破碎的脸。

下身牛仔裤、上身格子衬衫的王坚最后回头看了看身后沉默的微软亚洲研究院,认准了杭州的方向后,掉头不顾地大步而去。

这一年的9月,马云找到他,说现在的阿里巴巴需要他,就像当年的中国需要钱学森一样!

像理性一样冰冷的王坚不是个轻易就能打动的人,但是在听了马云的话后,他连伪装都没有带就跟着走了,以至于后来在阿里只能靠着马云一个人的信任抵抗着无所不在的质疑和非议。

王坚到阿里后不久,很快发现张瑞此前遇到的问题:当时阿里拥有亚洲第一的20个甲骨文RAC 集群节点,但 Oracle 数据库就像一个巨大的技术黑洞,每周都要出现好几次技术故障,而每次故障发生时,甲骨文的技术人员都在万里之外。

所以,王坚对马云说:“去OIE”势在必行,如果现在阿里巴巴不做技术研究,十年后,人们将看不到阿里巴巴!

2009年,北京,阿里云工程师写了第一行代码。

王坚在当年提交给阿里巴巴集团的报告中说:2010年以后,阿里巴巴再也不购买小型机。

放弃 Oracle,转投开源数据库?这些年大家在甲骨文数据库上的努力就这样白废了?这个决定下达后,阿里工程师围住了项目负责人后羿:“你TM今天不给大伙说清楚,就别想出这个门”!有人这样对后羿怒吼。
马云、王坚 和工程师们的合影

后羿说:“半年多了,我们所有人几乎天天半夜两点起床排除故障。但我们能做的只是把故障写成报告汇报到国外厂商。在别人眼里,我们是中国最好的技术人,但是,这种无法掌握自己命运的感觉,你、我还能承受多久?”

于是,阿里云的第一个开源数据库敢死队火速建立了,经过几次讨论后他们发现,虽然此前没做过开源,但是,开源数据库也不是想象的那么可怕。

经过几个月的闭门练功,小有所成的他们决定,先从淘宝“商品库”开始替换Oracle的数据库。

于是,就像非洲大草原上一望无际的斑马浩浩荡荡地向亚马逊平原进发一样,淘宝史上首次最宏伟壮观的数据大迁徙正式开始。

当时,风吹石走,电闪雷鸣。


阿里云的“数字屠夫”


这时,阿里云现在的“数字屠夫”褚霸,才刚刚赶上数据迁徙的大部队。

此前,作为网络技术精英的褚霸在迅雷工号前10、网易工号25,他在迅雷和网易所做的事是:把一道道复杂的程序解剖成底层电路上的蝌蚪一样的代码。

当时的褚霸,根本就没做过开源数据库,他所精通的网络技术和数据库虽有关联,但是所在的领域完全不一样,就像一个是物理,一个是英语,跨度非常之大。

但是当阿里找到他,要他组建一支志愿队支援底层研究受阻的后羿的开源数据库时,褚霸二话不说就顶了上去,就像《三国演义》中那个赤膊上阵的勇士许褚一样。
褚霸

褚霸问开源数据库的负责人之一的柏松:“I/O”(输入输出技术)要搞多久才能明白?

柏松很清醒地告诉他:“有生之年能搞懂就不错了。”

没想到,这句话把褚霸的火性给撩起来了:我弄了这么多年的技术,还没听说过哪个技术要花一辈子时间!

褚霸决定从Linux Kernal测试工具入手,那段日子,他每天要研究上万行代码,经常搞到凌晨三四点还不睡觉,好不容易睡着了,满脑子里的数据库还是像无数个天外飞花一样不断闪现,于是又一个激灵从床上爬起来,接着看代码 。

就这样疯狂地干了几个月,欲练神功,必先自宫的褚霸终于成功地……把自己送进了医院!

2011年7月,后羿和褚霸的联军终于完成了淘宝商品库从 Oracle 到 AliSQL 的大迁移,一年前才刚刚花高价购买的最后一台甲骨文小型机正式进入退役序列。

接下来的两年,整个阿里巴巴集团开始了史诗般的整体大迁徙。

2013年,最后一台小型机下线,这也标志着,阿里巴巴“去OIE”取得最后的胜利!


甲骨文:你们用我们的数据库要补钱!

阿里:对不起我们没有用!


2012年11月11日,考验阿里云工程师的一天终于来了:这是淘宝天猫所有数据库从 Oracle 替换成了AliSQL后迎来的第一个双11。

此前就有人预测,淘宝天猫在双11这天的总销售额肯定会超过100亿。

100亿销售额意味着什么?数据库里的一条热点记录,每秒最多要被修改10多万次,没有一定的承受能力,玄铁金钢做的数据库都要被蹂躏坏!

双11的零点钟声一敲响,被释放出的数据洪流一路怒吼着冲向AliSQL,几秒钟后,数据库资源占用值就像一架失事的飞机,直接撞向100%!

与此同时,阿里巴巴内部数据也迅速堆积起来,经过特殊冷处理的发动机像雪一样烧,AliSQL数据库也要像高峰期的12306一样,进入技术性暂停吗?

所有人的手都停在半空,就等着总指挥一声令下拍停数据库。如果不拍停,AliSQL数据库崩溃的后果是不可承受的,它是无数阿里数据库侠客无数个没日没夜打造出来的一把屠龙刀,这把刀坏了,已经不可以再煅造了!

经历了阿里历史上“最漫长的几秒”后,主屏幕上的成交数据终于松动了,数据库的运转速度一点一点的追上了全国人下单的速度,此前堆积起来的数据,像冰雪一样慢慢融化了。

第一次投入双11的AliSQL,顽强的抗住了全球最大购物节的最大峰值!

此时有人回头,看到站在窗户边的后羿,他正在看着窗外的远方:沉默的大地,沉默的天空,红色的血,继续的流。

2012年和2013年,AliSQL又分别抗住了191亿、350亿交易额带来的流量峰值。

2013年双11结束后不久,甲骨文找到阿里,对阿里说,根据你们“双11”公布的成交总额,甲骨文数据库用量比实际购买量多了很多,你们补一下账单吧。

然后,甲骨文拿出了一张账单,一张数额大得让阿里人瞠目结舌的账单!

阿里这时才告诉甲骨文:对不起,我们的核心数据库已经从 Oracle 替换成了我们自研的AliSQL。

直到阿里拿出证据,甲骨文才相信,阿里云团队用三年时间做成的开源数据库,已经超过了他们花了30多年沉淀的Oracle 系统!


这就是我要找的老板!


2017年10月,马云在云栖大会上宣布:成立“达摩院”,阿里要做一家技术型的公司;而且,达摩院要比102年的阿里巴巴活得更久一些。

19岁的阿里巴巴,像那梦里呜咽中的小河,让风尘刻画你的样子。

从马云在公开场合说要做云计算被BAT的其他两个大佬直接打脸,到中国最早的DBA研究;从做出中国第一个开源数据库,到自研数据库领先全球;从当日王坚的同事在台下齐声高喊“博士不哭”,到王坚成为中国工程院院士,阿里云的每一步,都在创造着历史。

2018年,达摩院数据库实验室筹备组开会,有人提出,犹他大学计算机系的终身教授,世界数据库领域的顶级大神李飞飞非常适合领导这个实验室。

在打听到李飞飞正在上海出差后,张瑞和圭多连夜坐火车去“截胡”李飞飞,通过交流后,张瑞心服口服:“这就是我要找的老板”。

李飞飞加盟阿里巴巴后,成为达摩院数据库与存储实验室的领头人。
李飞飞

2018年11月8日,美国计算机协会(ACM)公布2018年度的杰出科学家名单,阿里巴巴数据库事业部负责人李飞飞教授入选。


为了一个小点,

阿里云数据库侠客十数年青春耗尽


今天,阿里已经拥有POLARDB、POLARDB X、OceanBase、AnalyticDB、NoSQL、图数据库、时序时空数据库……一个个争奇斗艳。

这也意味着,在中国,我们第一次在数据库上拥有了最完整的生态!

而李飞飞在谈到数据库时,总是习惯说它“是个古老的领域”。

因为,在漫长的时空里,一大批的数据库侠客正在耐心地寻找着下一个技术点的爆发,在此过程中,“传统数据库步履蹒跚”。

2018年,新的技术点爆发来了:阿里云成为国内企业中在Gartner 数据库魔力象限中首个入选的中国科技公司,中国终于有了一个直接和AWS、Google、Oracle 等国际大牌在国际范围里一拼高下的产品!

在Gartner 数据库魔力象限的坐标上,代表阿里云整体技术的只是一个微不足道的小点,但就是为了这个点能够在世界权威公认的象限里挪动一点点,无数阿里数据库侠客十数年的青春已然耗尽!

从2009年阿里云准备自研技术到现在,阿里云的草莽英雄云集,技术大牛丛生,更不乏像王坚这样的两院院士;但是这段时间里,也有更多的数据库人离开阿里云这个大家庭。但是,侠客远去,热血还在,他们仍然通过独立创业等方式,和这个耗尽了韶华的事业紧紧纠缠在一起。

致敬!阿里云的数据库侠客:但行远方,莫问归程!


商务合作请联系微信\QQ:2881339633


今日福利


我们有各类电商行业交流群,

扫码添加,找小助手拉你进群



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存