查看原文
其他

别把宝都押在一家云服务提供商上!

2015-09-28 云头条

未来,奉行双云服务提供商策略才是大势所趋。



上周末,亚马逊网络服务(AWS)遭遇了持续六小时的云服务严重停运事件,甲骨文公司大做文章。甲骨文的Phil Dunn在推特上发布消息:“一分价钱一分货”,不过要注意:所有观点都是他一已之见,未必代表甲骨文的官方观点。不过你明白意思。


没错,这回亚马逊算是颜面扫地;面对这个云计算巨擘的失误,竞争对手们准会幸灾乐祸。不过,受此故障影响的还有互联网上几个最知名的品牌。


Netflix、Tinder、Airbnb和IMDb都出现了网站停运或故障。真应了这句老话:城门失火,殃及池鱼。


要说哪家服务商备受崇敬,那就是Netflix,它大概也是AWS最备受瞩目的客户――这个引荐客户居然靠AWS提供服务,这个例子表明如果你把宝全部押在AWS上面,到底能走得多远。


要是没有AWS,我们所知道的Netflix会不会存在值得怀疑。Netflix将不得不继续投资于自己的数据中心构建计划和技术专家团队,以构建神奇的弹性系统。要是它真那样,可能Netflix现在就成了亚马逊,向别人出售闲置的计算容量和专业技能。相反,它把数据中心这块外包给了亚马逊。


而在另外的时候,人们会强烈提醒,切勿依赖单单一家供应商来满足关键的IT需求。而在互联网上,这句忠告被抛到了九霄云外。


但是Netflix没有吃一堑长一智吗?2008年,在自己的数据中心遭到重大故障后,加上业务有望迎来巨幅增长,Netflix迁移到了AWS的平台。它认为,最好还是信赖专业人员。然而在2011年4月,Netflix还是因为AWS遭到了严重故障。现在,据说Netflix要关闭其最后一个自家运营的数据中心,完全改用AWS的数据中心。


不过等一下。亚马逊不是应该羞愧地垂下头的唯一一家云服务提供商。实际上这个行当还有其他许多云服务提供商要扪心自问:拥有Azure和Office 365的微软、Salesforce和谷歌,它们在过去几年都遇到过故障,故障时间长短不一,短的仅仅持续几小时,长的持续数天。在它们看来,这没什么大不了――只是它们承诺的正常运行时间保持在99.999%的统计舍入误差而已。可是从另一方面来看,这又意味着业务收入损失。


说来也不相信,Netflix上了头条新闻,就因为电视观众只好换频道,要么走到外面去散心。但是在更广泛的大众和成千上万的公司看来,这意味着确实无法开展业务:无法使用ERP来管理生产或供应商,无法使用CRM来开展销售或与客户交谈,无法使用电子邮件来与同事交流。你唯一的选择就是,只好不断地点击状态页面上的刷新按钮。如果你仔细看一下,就会发觉那个统计舍入误差突然看起来很大。


许多客户一直将这种基础设施交给公有云提供商去打理,而且说服了自己:这些是最专业、最见多识广的厂商。正常运行时间和服务器是它们的专长,所以它们运行这些东西比自己来得可靠。


这样一来,当所谓的专家们设法搞砸了计划维护工作后,客户更加困惑不解了。


或者,就像AWS在上个周末遇到的情况那样,亚马逊并未从表明其DynamoDB NoSQL数据库服务访问越来越频繁的问题中瞧出什么苗头。对全局二级索引(Global Secondary Indexes)的需求让元数据服务器不堪重负,迫使系统陷入停顿。更糟糕的是,亚马逊当初没有预料到这可能是个问题,所以没有合理安装监控服务,无法真正认识到这是一次故障。


前景并非完全黯淡


不过也有一个亮点。


尽管这回Netflix颇为难堪,上个周末还是有另外许多AWS客户似乎没有受到影响,其中就有新闻英国(News UK)。媒体大亨Rupert Murdoch掌舵的这家新闻集团在AWS上运行收费墙、访问控制系统,以及平板电脑版和互联网版的《泰晤士报》、《星期日泰晤士报》和《太阳报》。它们并没有出现服务瘫痪。


想避免网站停运,最好的办法就是,你设计的服务在遇到故障后能顺利切换到同一个地区的不同节点。更好的办法是,切换到不同地区。AWS服务故障集中在该巨头的美国东部地区――它在全球还有另外八大地区。


你可以在自己选择的云平台上建立一个缓存层来传送数据副本。就像电视和电台上的延时,阻止不雅词语通过电波传播开来。你处理的一直是缓存数据,直到你复制副本和更新数据后,底层数据才会复原。


另一个办法就是,不要依赖单单一家云服务提供商。这是IaaS和PaaS用户、而不是SaaS用户更容易获得的一种选择。


我们采访的CIO们并没有选择单单一家IaaS或PaaS提供商,他们采用了双云战略,选择不止一家云服务提供商。比如说,他们可能会为计算服务选择AWS,为存储服务选择谷歌。或者出于竞争方面的考虑,为一个业务部门选择AWS,为另一个业务部门选择微软Azure。当然,还有其他的地区和全球公有云公司可供选择。


是的,这有助于故障切换,但同时也有助于确保你不会受到一家提供商的牢牢束缚。选择多家提供商让你可以获得最实惠的价格,双有助于确保几家公有云提供商没有一开始就不重视你。


Cassandra数据库提供商DataStax最近告诉我,它在过去12个月看到采用双云战略的现象日益增多。


DataStax本周加入了微软的企业云联盟(Enterprise Cloud Alliance),这意味着它的Cassandra实现系统与Azure整合起来,可支持自动化的、向导驱动的部署;DataStax还宣布推出企业4.8版本。DataStax之前已经可以在Azure上运行,如今在AWS上也可以运行。


DataStax首席执行官Billy Bosworth说:“客户想要多家云服务提供商,我们看到越来越多这样的例子。人们在考虑不把所有的鸡蛋都放在一只云篮子里,而是在比较每一种解决方案的优缺点。”


最终目标是,万一出现了紧急情况,能够将工作负载移植到另一家提供商的平台上,实现真正的负载故障切换。


也就是说,万一服务器、数据中心或网络连接出现了故障,可以将你的数据或应用程序在IaaS提供商之间移动,就像你在数据中心提供商之间切换流量那样。一些提供商声称能提供这项服务,但不清楚如何实现。


此外,数据的实际移动需要花费真金白银。公有云提供商让你可以随时查看新的数据,如果数据不变化,租费很少。当你在其云上移动数据,或者想要提取数据时,租费只会有增无减。


对于Netflix过于依赖AWS的做法,许多人会摇头反对。这种把宝都押在AWS上的举措有害无益。IaaS和PaaS领域还有其他办法可以选择。现在是时候走多远化道路的时候了。


新闻来源:The Register|云头条翻译(未经授权谢绝转载)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存