别把宝都押在一家云服务提供商上！

查看原文

其他

别把宝都押在一家云服务提供商上！

2015-09-28 云头条

未来，奉行双云服务提供商策略才是大势所趋。

上周末，亚马逊网络服务（AWS）遭遇了持续六小时的云服务严重停运事件，甲骨文公司大做文章。甲骨文的Phil Dunn在推特上发布消息：“一分价钱一分货”，不过要注意：所有观点都是他一已之见，未必代表甲骨文的官方观点。不过你明白意思。

没错，这回亚马逊算是颜面扫地；面对这个云计算巨擘的失误，竞争对手们准会幸灾乐祸。不过，受此故障影响的还有互联网上几个最知名的品牌。

Netflix、Tinder、Airbnb和IMDb都出现了网站停运或故障。真应了这句老话：城门失火，殃及池鱼。

要说哪家服务商备受崇敬，那就是Netflix，它大概也是AWS最备受瞩目的客户――这个引荐客户居然靠AWS提供服务，这个例子表明如果你把宝全部押在AWS上面，到底能走得多远。

要是没有AWS，我们所知道的Netflix会不会存在值得怀疑。Netflix将不得不继续投资于自己的数据中心构建计划和技术专家团队，以构建神奇的弹性系统。要是它真那样，可能Netflix现在就成了亚马逊，向别人出售闲置的计算容量和专业技能。相反，它把数据中心这块外包给了亚马逊。

而在另外的时候，人们会强烈提醒，切勿依赖单单一家供应商来满足关键的IT需求。而在互联网上，这句忠告被抛到了九霄云外。

但是Netflix没有吃一堑长一智吗？2008年，在自己的数据中心遭到重大故障后，加上业务有望迎来巨幅增长，Netflix迁移到了AWS的平台。它认为，最好还是信赖专业人员。然而在2011年4月，Netflix还是因为AWS遭到了严重故障。现在，据说Netflix要关闭其最后一个自家运营的数据中心，完全改用AWS的数据中心。

不过等一下。亚马逊不是应该羞愧地垂下头的唯一一家云服务提供商。实际上这个行当还有其他许多云服务提供商要扪心自问：拥有Azure和Office 365的微软、Salesforce和谷歌，它们在过去几年都遇到过故障，故障时间长短不一，短的仅仅持续几小时，长的持续数天。在它们看来，这没什么大不了――只是它们承诺的正常运行时间保持在99.999%的统计舍入误差而已。可是从另一方面来看，这又意味着业务收入损失。

说来也不相信，Netflix上了头条新闻，就因为电视观众只好换频道，要么走到外面去散心。但是在更广泛的大众和成千上万的公司看来，这意味着确实无法开展业务：无法使用ERP来管理生产或供应商，无法使用CRM来开展销售或与客户交谈，无法使用电子邮件来与同事交流。你唯一的选择就是，只好不断地点击状态页面上的刷新按钮。如果你仔细看一下，就会发觉那个统计舍入误差突然看起来很大。

许多客户一直将这种基础设施交给公有云提供商去打理，而且说服了自己：这些是最专业、最见多识广的厂商。正常运行时间和服务器是它们的专长，所以它们运行这些东西比自己来得可靠。

这样一来，当所谓的专家们设法搞砸了计划维护工作后，客户更加困惑不解了。

或者，就像AWS在上个周末遇到的情况那样，亚马逊并未从表明其DynamoDB NoSQL数据库服务访问越来越频繁的问题中瞧出什么苗头。对全局二级索引（Global Secondary Indexes）的需求让元数据服务器不堪重负，迫使系统陷入停顿。更糟糕的是，亚马逊当初没有预料到这可能是个问题，所以没有合理安装监控服务，无法真正认识到这是一次故障。

前景并非完全黯淡

不过也有一个亮点。

尽管这回Netflix颇为难堪，上个周末还是有另外许多AWS客户似乎没有受到影响，其中就有新闻英国（News UK）。媒体大亨Rupert Murdoch掌舵的这家新闻集团在AWS上运行收费墙、访问控制系统，以及平板电脑版和互联网版的《泰晤士报》、《星期日泰晤士报》和《太阳报》。它们并没有出现服务瘫痪。

想避免网站停运，最好的办法就是，你设计的服务在遇到故障后能顺利切换到同一个地区的不同节点。更好的办法是，切换到不同地区。AWS服务故障集中在该巨头的美国东部地区――它在全球还有另外八大地区。

你可以在自己选择的云平台上建立一个缓存层来传送数据副本。就像电视和电台上的延时，阻止不雅词语通过电波传播开来。你处理的一直是缓存数据，直到你复制副本和更新数据后，底层数据才会复原。

另一个办法就是，不要依赖单单一家云服务提供商。这是IaaS和PaaS用户、而不是SaaS用户更容易获得的一种选择。

我们采访的CIO们并没有选择单单一家IaaS或PaaS提供商，他们采用了双云战略，选择不止一家云服务提供商。比如说，他们可能会为计算服务选择AWS，为存储服务选择谷歌。或者出于竞争方面的考虑，为一个业务部门选择AWS，为另一个业务部门选择微软Azure。当然，还有其他的地区和全球公有云公司可供选择。

是的，这有助于故障切换，但同时也有助于确保你不会受到一家提供商的牢牢束缚。选择多家提供商让你可以获得最实惠的价格，双有助于确保几家公有云提供商没有一开始就不重视你。

Cassandra数据库提供商DataStax最近告诉我，它在过去12个月看到采用双云战略的现象日益增多。

DataStax本周加入了微软的企业云联盟（Enterprise Cloud Alliance），这意味着它的Cassandra实现系统与Azure整合起来，可支持自动化的、向导驱动的部署；DataStax还宣布推出企业4.8版本。DataStax之前已经可以在Azure上运行，如今在AWS上也可以运行。

DataStax首席执行官Billy Bosworth说：“客户想要多家云服务提供商，我们看到越来越多这样的例子。人们在考虑不把所有的鸡蛋都放在一只云篮子里，而是在比较每一种解决方案的优缺点。”

最终目标是，万一出现了紧急情况，能够将工作负载移植到另一家提供商的平台上，实现真正的负载故障切换。

也就是说，万一服务器、数据中心或网络连接出现了故障，可以将你的数据或应用程序在IaaS提供商之间移动，就像你在数据中心提供商之间切换流量那样。一些提供商声称能提供这项服务，但不清楚如何实现。

此外，数据的实际移动需要花费真金白银。公有云提供商让你可以随时查看新的数据，如果数据不变化，租费很少。当你在其云上移动数据，或者想要提取数据时，租费只会有增无减。

对于Netflix过于依赖AWS的做法，许多人会摇头反对。这种把宝都押在AWS上的举措有害无益。IaaS和PaaS领域还有其他办法可以选择。现在是时候走多远化道路的时候了。

新闻来源：The Register｜云头条翻译（未经授权谢绝转载）

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…