查看原文
其他

AWS厌倦了不是为云构建的技术:因为一旦出岔子,"爆炸半径"就很大!

AWS云计算 云头条 2021-04-27
这就是为什么AWS从底层的固件一路开始构建自己的UPS,这也是构建Graviton处理器的原因。



AWS厌倦了不是为云度身定制的技术,希望自己构建的技术对用户更具吸引力。

在这个云巨头召开的re:Invent大会上的“基础架构主题演讲”中,全球基础架构领导人Peter DeSantis透露了关于AWS如何保持自身优势的一些信息。


他透露,AWS自行设计了不间断电源(UPS),现在其每个机架中都有一个UPS。AWS之所以决定采用这种方法,是由于它需要的UPS系统非常庞大,以至于需要一个专用房间来放置确保系统正常运行所需的大量铅酸电池。需要维护该设施增添了更多的风险,而且一旦发生故障或灾难,会面临更大的“爆炸半径”。


DeSantis解释道,AWS旨在缩小爆炸半径(即影响范围),因此该公司过去为第三方产品编写了其自己的UPS固件。

DeSantis说:“基础架构中不归你拥有的软件是一种风险。”他概述了一种场景:将设备中的固件问题告知供应商,开始试图再现问题的过程,然后开发修复程序,最后部署。解决一个问题可能需要一年时间。”对于AWS来说,这样实在太慢了,因为一个错误可能意味着客户停机。

借助AWS自己设计的UPS系统,一旦发生故障,这些设备就会从普通市电切换到UPS;AWS还设计了自己的软件来管理交换机设备。

亚马逊自行开发的Arm处理器Graviton2是出于类似原因而开发的。

DeSantis表示,商用UPS和交换机设备无法满足其需求的原因在于,它们是针对可以派上用场的许多场景设计的,不是针对亚马逊的要求设计的。他表示,开发CPU出于同样的道理,英特尔和AMD之类的厂商设计的产品通过成为通用设备而成为畅销品,结果是处理器集成了使其适合更多任务的功能部件。需要原始性能时,多核CPU就是解决之道。当CPU的利用率成为问题时,同时多线程(SMT)随之出现。

DeSantis认为,没有哪项技术离开过主流CPU,结果是CPU架构很容易遭到侧通道攻击,而且提供可变的性能(这就是高性能计算即HPC人群关闭SMT的原因)。

AWS为云设计处理器,因此它致力于研发Graviton、多核架构和超大容量缓存,因为这些技术可以带来每个核心更好的性能,无需其他技巧。架构一开始就是为微服务设计的,AWS将微服务视为软件开发的主导性浪潮。

DeSantis说:“Graviton 2的每瓦特性能比我们云中的其他任何CPU都要高出2.5倍至3倍。只有借助AWS的Nitro芯片才能获得这种性能,这个云巨头将虚拟化和网络工作负载卸载到了Nitro芯片上。”

AWS Nitro卡(见左下角)

DeSantis拒绝透露Nitro设备的内部构造,但确实表示该公司正在使用第四代设备,将它们描述为SmartNIC是不正确的。

他说:“SmartNIC是其功能的一部分。对于我们来说,它是非常专用化的硬件,其实是为AWS深入设计的。”DeSantis表示:“逻辑上有一些相似之处,但是它非通用化。”

然后他在主题演讲中展示了这样一款技术,表示它通过Thunderbolt连接到AWS新的Mac实例。


他还表示,AWS很清楚其数据中心之间的距离是互为灾备的,相隔不到一毫秒的延迟。此外,这种配置满足了云应用软件的需求:足够的距离以确保安全,但又不那么考验网络、以至于无状态应用软件无法顺畅运行。

以下为在亚马逊 re:Invent 2020 上,AWS 全球基础架构和客户支持资深副总裁 Peter DeSantis 发表了基础架构主题演讲的其他内容。

 

在此次演讲中,他主要提及了近年来 AWS 在基础架构服务领域的主要尝试,包括提高服务的持续性与稳定性、关注客户的个性化芯片定制以及基础设施的绿色可持续。


稳定运营,出色运维


出色的可用性不仅仅是保持一切正常运行。

数据中心的稳定运营十分重要,“具有冗余的并发可维护性”(Concurrent maintainability with redundancy)始终是 AWS 设计的重要方面。因此 AWS 设计采用了包括多个可用区在内的多种方式以确保实现这一目标。


AWS 细分 Region 和 Available Zone,这与其他云提供商有很大不同:

1) 远距离的可用区设置,可以降低自然灾难(火灾,水灾…)带来的业务中断风险;

2) 用户选择最近站点接入以低延迟访问 AWS 云资源;

3) AWS 分别管理每个区域中的运维,将故障分割;

“量体裁衣”,定制芯片


AWS 云平台通过 AWS Nitro 控制器向 Amazon EC2 添加网络,存储和安全资源;AWS 已在 Mac Mini 上安装了 Nitro Controller,没有 Hypervisor 的 Nitro Controller 可以安全快速地连接到 Mac Mini。Mac Mini 现在可以使用任何本地 AWS 服务。


AWS Nitro 芯片发展迅速,最新版本 version 4为新的 C6gn 实例提供了动力。


AWS Graviton 是基于 ARM 的芯片组,今年推出了 AWS Graviton 2 作为通用处理器;高性价比的 AWS Graviton 2 不仅可以很好地处理前端工作负载,对于 IO 密集型工作负载也很友好。

致力环保,绿色运营


“亚马逊正致力于为我们自身的各业务单元提供更多可在再生能源供应,并希望凭借用快速有效地行动,为应对全球气候变化做出应有的贡献。


—— Jeff Bezos


AWS 的技术创新使得 AWS 数据中心比其他企业级数据中心为节能环保贡献更多。即使在我们最大的数据中心,我们用水量也与 25 个美国家庭相当。我们 96% 的废水得到再利用。

451 Research 的调查研究结果显示,AWS 的基础设施的能源效率是被调查的美国企业数据中心中位数的 3.6 倍。这种优势的三分之二以上归因于更节能的服务器数量和更高的服务器利用率。

AWS 致力于以尽可能环保的方式运营我们的业务,并实现全球基础设施 100% 使用可再生能源。AWS 正朝着到 2025 年 100 % 利用可再生能源的道路前进,比我们最初的 2030 年目标提前了五年。

AWS 通过以下方式,把这项承诺落地到实处:

AWS 用多项举措来提高我们的用水效率,减少用于冷却数据中心的饮用水的使用。AWS 通过评估每个 AWS 区域的气候模式、当地水资源管理和可用性以及保护饮用水水源的机会来制定我们的用水战略。


AWS 把这些水通过“云”数据中心进入运河,灌溉庄稼,当它们蒸发后,就变成了另一种“云”!

2020 年 5 月,亚马逊宣布了五个新的公用事业规模的太阳能项目,为中国、澳大利亚和美国的全球业务提供电力,一共增加 615 MW 再生能源发电能力,预计每年发电 120 万 MW。

今年 3 月,亚马逊宣布在澳大利亚、西班牙、瑞典和美国投资四个新的可再生能源项目,这些项目预计每年将产生大约 840,000 MWh 的能源和额外产生近 300 MW 的可再生能源发电能力。

在数据中心建设的水泥生产过程中,AWS 在混凝土生产中添加 CO2 和使用补充水泥材料来进一步减少 CO2 的排放。


今年 12 月,亚马逊宣布了宣布了 26 个新的公用事业规模的风能和太阳能项目,新项目的总发电能力为 3.4 GW。

2020 年亚马逊对可再生能源的总投资项目已达到 35 个,装机容量超过 4 GW,这也是目前世界上单一企业在1年内对可再生能源的最大的一笔投资。
 
这些新项目将使亚马逊所拥有的可再生能源的的总装机容量在 2020 年达到 6.5 GW,并成为有史以来最大的企业可再生能源采购商。



以上就是本次主题演讲的精彩内容,还没有报名参加亚马逊 re:Invent 2020 的小伙伴可要抓紧时间啦,错过这次,可不知道还要再等多少年才能免费参加咯~

咳咳,好消息可不止一个哦!

为给中国区用户更好的观看体验,目前我们已上线

包括 AWS 首席执行官 Andy Jassy

及其他 AWS 技术领袖等中文字幕演讲视频

热爱了解云计算资讯的你

一定不能错过这些精彩内容噢!

扫描下方二维码,即刻观看!



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存