查看原文
其他

阿里云又宕机!

伍杏玲 整理 CSDN 2019-03-28

在云界流传着一句话:“运行不稳定,宕机两行泪!”

这不,今天凌晨因为阿里云宕机,不少华北互联网公司的程序员、运维人员接到报警后从被窝爬起来干活去了。

58一程序员如此描述今早的惊魂几小时:“很多朋友经历了昨晚阿里云3小时左右的故障,我司的业务也收到了一定影响,技术的同事一起熬夜奋战,最终观察服务稳定运行了两个多小时,直到凌晨五六点多才逐渐登出VPN。”[1]

对此,阿里云官方发布公告:华北2地域可用区C部分ECS服务器等实例出现IO HANG。针对本次故障,将根据SLA协议,尽快处理赔偿事宜。

这已经不是阿里云第一次出事故了:10天前,阿里云泄露 40 家名企源代码;去年6月份,阿里云官网的部分管控功能,及 NAS、OSS 等产品的部分功能出现访问异常。


为何阿里云宕机影响巨大?


在CSDN的2018-2019开发者大调查报告显示,在国内公有云市场中,阿里云的市场占额最大,高达67%,远超第2至5名的总和。

据阿里云官方文档显示:“中国有40%的网站都运行在阿里云上,一半独角兽公司都在阿里云。”

             

所以说,阿里云轻微一抖动,影响中国近半数的互联网网站啊!

“云”非百分百靠谱,且云且珍惜


虽然阿里云承诺会赔偿,可阿里云故障频出,不仅让众多IT人忙得人仰马翻,还让网友略微心寒啊:

这不仅仅是一个赔偿的问题,对于客户来说访问不了或造成高于赔偿多少倍的有形无形损失,技术方面仍然需要过硬啊!

把业务系统部署在平台上,要的就是安全、稳定和可靠,不是赔偿的事儿。

甚至有人想更换一个云商,但无论是公司自搭建服务器平台或者各家云商,从没有说自己的产品是100%安全的。

阿里云的官方文档清楚地写道:“对于单实例维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.95%;对于单地域多可用区维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.99%”。


那么作为程序员,我们在设计系统架构时,系统的容灾性必须要考虑完整:“在每一层都假设依赖的服务出故障时该怎么应对,要么冗余,要么降级,一定要考虑,不能把生命完全交给别人控制。避免单点故障,采用多台云服务器的时候还要考虑不同可用区,否则单个可用区也可能彻底挂掉。[2]

参考资料:

[1]架构师之路《这一次,除了骂阿里云,还能做些什么?》

[2]阿里云社区《IT之家,这不是个案》

【完】

 热 文 推 荐  

☞ 光凭 5G 根本无法解决宽带问题!

☞ 爬取 4400 条淘宝洗发水数据,拯救你的发际线!(附代码和数据集)

 如今,你感受到内存技术的“思维速度”了吗?

☞ 程序员写代码没激情该怎么破?

☞ 跨界打击, 23秒绝杀700智能合约! 41岁遗传学博士研究一年,给谷歌祭出秘密杀器!

☞ 90后美女学霸传奇人生:出身清华姚班,成斯坦福AI实验室负责人高徒

☞ 神操作!这段代码让程序员躺赚200万?给力!

print_r('点个好看吧!');
var_dump('点个好看吧!');
NSLog(@"点个好看吧!");
System.out.println("点个好看吧!");
console.log("点个好看吧!");
print("点个好看吧!");
printf("点个好看吧!\n");
cout << "点个好看吧!" << endl;
Console.WriteLine("点个好看吧!");
fmt.Println("点个好看吧!");
Response.Write("点个好看吧!");
alert("点个好看吧!")
echo "点个好看吧!"

点击阅读原文,输入关键词,即可搜索您想要的 CSDN 文章。

喜欢就点击“好看”吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存