阿里云又宕机!
在云界流传着一句话:“运行不稳定,宕机两行泪!”
这不,今天凌晨因为阿里云宕机,不少华北互联网公司的程序员、运维人员接到报警后从被窝爬起来干活去了。
58一程序员如此描述今早的惊魂几小时:“很多朋友经历了昨晚阿里云3小时左右的故障,我司的业务也收到了一定影响,技术的同事一起熬夜奋战,最终观察服务稳定运行了两个多小时,直到凌晨五六点多才逐渐登出VPN。”[1]
对此,阿里云官方发布公告:华北2地域可用区C部分ECS服务器等实例出现IO HANG。针对本次故障,将根据SLA协议,尽快处理赔偿事宜。
这已经不是阿里云第一次出事故了:10天前,阿里云泄露 40 家名企源代码;去年6月份,阿里云官网的部分管控功能,及 NAS、OSS 等产品的部分功能出现访问异常。
为何阿里云宕机影响巨大?
在CSDN的2018-2019开发者大调查报告显示,在国内公有云市场中,阿里云的市场占额最大,高达67%,远超第2至5名的总和。
据阿里云官方文档显示:“中国有40%的网站都运行在阿里云上,一半独角兽公司都在阿里云。”
所以说,阿里云轻微一抖动,影响中国近半数的互联网网站啊!
“云”非百分百靠谱,且云且珍惜
虽然阿里云承诺会赔偿,可阿里云故障频出,不仅让众多IT人忙得人仰马翻,还让网友略微心寒啊:
这不仅仅是一个赔偿的问题,对于客户来说访问不了或造成高于赔偿多少倍的有形无形损失,技术方面仍然需要过硬啊!
把业务系统部署在平台上,要的就是安全、稳定和可靠,不是赔偿的事儿。
甚至有人想更换一个云商,但无论是公司自搭建服务器平台或者各家云商,从没有说自己的产品是100%安全的。
阿里云的官方文档清楚地写道:“对于单实例维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.95%;对于单地域多可用区维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.99%”。
那么作为程序员,我们在设计系统架构时,系统的容灾性必须要考虑完整:“在每一层都假设依赖的服务出故障时该怎么应对,要么冗余,要么降级,一定要考虑,不能把生命完全交给别人控制。避免单点故障,采用多台云服务器的时候还要考虑不同可用区,否则单个可用区也可能彻底挂掉。”[2]
参考资料:
[1]架构师之路《这一次,除了骂阿里云,还能做些什么?》
[2]阿里云社区《IT之家,这不是个案》
【完】
热 文 推 荐
☞ 爬取 4400 条淘宝洗发水数据,拯救你的发际线!(附代码和数据集)
☞ 跨界打击, 23秒绝杀700智能合约! 41岁遗传学博士研究一年,给谷歌祭出秘密杀器!
☞ 90后美女学霸传奇人生:出身清华姚班,成斯坦福AI实验室负责人高徒
print_r('点个好看吧!');
var_dump('点个好看吧!');
NSLog(@"点个好看吧!");
System.out.println("点个好看吧!");
console.log("点个好看吧!");
print("点个好看吧!");
printf("点个好看吧!\n");
cout << "点个好看吧!" << endl;
Console.WriteLine("点个好看吧!");
fmt.Println("点个好看吧!");
Response.Write("点个好看吧!");
alert("点个好看吧!")
echo "点个好看吧!"