其他

亚马逊云服务因工程师手滑掉线5小时,半个北美的码农都放假改做段子手了

2017-03-03 DeepTech深科技



本周二,美国顶级云服务供应商亚马逊AWS旗下的Simple Storage Service (简单存储服务),简称S3,因为一名工程师手滑而掉线了5个小时。由于受到影响的US-EAST-1,也就是北弗吉尼亚地区,是北美东部的主要数据中心之一,这一事故导致亚马逊AWS多个客户的网站和服务同时掉线。


因为网站后台也处在AWS上,这些公司的码农们被迫放了半天假。但是,程序猿之魂是无法停下来的,所以,这群无所事事的码农们统统转成段子手,在Twitter上开始说相声。



据亚马逊周四公布的事故报告显示,本周二(2月28日)美国东部时间下午12点37分,一名“有授权”的S3工作人员,在使用一个“既定指令”时输入了错误的指令,也就是码农和游戏界俗称的“手一滑”。


本该删除S3子系统里一小部分服务器的指令成为了删除S3子系统里绝大部分的服务器的指令。被删除的服务器中包括索引系统(Index Subsystem)以及排位系统(Placement Subsystem)这两个至关重要的服务。因此,AWS S3被迫重启。


但是,由于AWS在过去的几年里获得了巨大的增长,曾经合理的重启设计面对如今的巨量数据,花了整整5个小时才完成。通俗的讲,亚马逊AWS吃的太胖了,以前翻个身只要半个小时,如今花了大半个工作日。



从下午12点到5点,北美数个大型网站和网络服务被迫下线。其中比较著名的有谷歌智能家居品牌Nest,其联网监视器以及手机APP无法工作,Quora(外网知乎),Trello,Docker Registry Lab,GitHub和GitLab等码农网站,Medium,Slack,Medium和Business Insider等新闻网站,Twitch.tv(游戏直播网站),以及大量使用S3存储图片和视频等媒体文件的网站:Adobecloud,,Zendesk,Heroku,Coursera, Bitbucket,Autodesk's cloud,Twilio,Mailchimp,Citrix,Expedia,Flipboard。


当然,小编觉得最搞笑的莫过于当时正在英国爱丁堡进行的AWSome Day(AWS训练日),有一名讲师刚吹嘘完AWS的可靠性,就被piapia打脸。


所以,大量无所事事的码农就开始在Twitter上写段子:


全体员工注意:我们进入红色警报—咖啡机也是用AWS的!


如果你在旧金山参加2017年游戏开发者大会,你刚听到的满城警报是公众紧急警报测试,不是AWS S3的系统警报


由于AWS掉线,以及其对Snapchat和其他APP的影响,数百万年轻人终于抬起了他们头


*想为AWS掉线事故做个动图表情*

*发现所有动图表情网站都是用US-EAST-1的*


亚马逊S3在US-EAST-1地区掉线了。大家保持镇定,那只是互联网的70%


AWS S3掉线后随着掉线的东西:

1.       你的App

2.       你App的警报

3.       你使用的服务工具

4.       你对互联网的信心



S3掉线后的工程师们(终于可以玩耍了):


AWS S3掉线了 ?! 科技界:




《麻省理工科技评论》中美合作“城郭会员计划”正式发布,让您始终处于新兴技术商业趋势的最前沿。详情请点击下方图片查看↓↓↓




招聘

编辑、视觉设计、视频策划及后期

地点:北京

联系:hr@mittrchina.com


MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。

分享至朋友圈才是义举


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存