查看原文
其他

大事故!Google云 震惊了全球金融科技界

IDC圈 DataCenter运营管理
2024-10-06

导 读

    本月,由于谷歌云工程师操作失误,管理着1250亿美元资产的投资公司UniSuper的整个云环境被删除。虽然UniSuper做了灾备,并部署在不同的地理位置,以确保服务的连续性,但由于云订阅账户被删除,导致两个地区的数据都被删除了。不过幸运的是,UniSuper在另一家云服务商那里存有的备份,成为了他们的救命稻草,但是恢复业务花了超过一周的时间,其62万会员一周都无法访问。

    这场灾难告诉我们,即使做了灾备,也不能丢掉传统备份;做了灾备不是万事大吉了,做好业务连续性管理格外重要

    员工都会有疏忽、设备都会出故障、软件都会有Bug、新技术的应用也会引入新的风险……但是会不会因此导致灾难,就要看业务连续性管理的水平了。


  世界就是个草台班子——最近科技巨头谷歌云用亲身行动再次佐证了这一论断。

    5月9日,一个前所未有的事件震惊了全球金融科技界:由于谷歌云工程师操作失误,投资公司UniSuper的整个云环境被删除,数十万的用户数据和资产记录被清空。目前没有详细的信息表明这次故障出现在什么时候,不过在5月9日双方宣布系统恢复时,UniSuper的服务已经中断了超过一周的时间。

    据报道,此次失误源于在一次例行维护过程中,Google Cloud的工程师们不慎触发了一个隐藏的软件漏洞,导致UniSuper的私有云账户被意外删除。这一事件导致数十万的UniSuper基金会员无法访问他们的养老金账户。

    Google Cloud方面承认,由于配置过程中的一个失误,导致UniSuper的私有云服务订阅被意外删除。这一“前所未有的配置错误”不仅仅导致了服务的中断,更重要的是,它揭示了即使是云服务巨头也可能犯下的错误。

    UniSuper的CEO Peter Chen和Google Cloud的全球CEO Thomas Kurian发表了联合声明,为这一“极其令人沮丧和失望”的中断向用户道歉。

    CEO Peter Chun表示:“我们对会员们遭受的不便深感歉意。这次事件是一个警钟,提醒我们即使是最先进的技术也可能出现意外。”Google Cloud的全球CEO Thomas Kurian也发表声明:“我们对此次事件造成的影响深表歉意,并已采取措施确保不会再有类似情况发生。”

    此外,尽管UniSuper通常在两个地理位置有数据备份,以确保服务的连续性,但由于云订阅的删除,导致两个地理位置的数据都被删除了。

    不过幸运的是,UniSuper在另一家云服务商那里存有的备份,这成为了他们的救命稻草。在紧急恢复行动中,这些备份发挥了关键作用,最终帮助UniSuper恢复了服务。

    备份!

    多重备份!

    跨平台备份!

    显然,这一事件给我们的启迪,不是如何谨慎的应对技术,如何完善系统,而是:在这个充斥着草台班子的世界里,做好备份,并且是多重备份和跨平台备份,才是最重要的。

| 文章来源:中国IDC圈



延伸阅读

数据中心领域新国标GB/T 42581-2023《信息技术服务 数据中心业务连续性等级评价准则》 于2023年12月1日起实施

中国标准走出去——两部数据中心领域国家标准外文版发布

数据中心业务连续性等级成为数据中心重要指标


素材来源官方媒体/网络新闻
继续滑动看下一个
DataCenter运营管理
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存