分享

重大事故,谷歌云惹大事了:误删账户、数据丢失、服务瘫痪一周...

 IT软件推荐员 2024-05-13 发布于云南

5月11日,也就是前天的重磅消息

谷歌云误删UniSuper账户,从5月2日开始长达一周服务处于瘫痪状态

作为一名IT人,不管你是做运维的还是做网络的,大家都应该关注这件事或者类似的事件。在这一年之内,发生了多起类似运维事故,而且基本都是重大事故,发生问题的服务商基本都是国内外都比较主流的服务商,可想而知,现在的IT行业对运维、安全的要求是越来越高,出了这么多安全事故,现在不管是大公司还是小公司都越来越重视运维安全,接下来聊聊谷歌云这次的事故。

事件描述

由于谷歌云的配置误操作,UniSuper的云账户被意外删除,导致该公司的云环境被清空,包括数十万用户的数据和资产记录。

UniSuper是一家有40年历史的养老基金公司,管理着约1250亿美元的资金,拥有超过62万会员。

UniSuper之前使用的是Azure和自家数据中心,去年迁移到谷歌云上。在这次事故发生之前,UniSuper在谷歌云上进行了数据备份,但由于谷歌云误删除了他们的私有云订阅账户,导致两个区域的数据都被清空。

这次删库故障直接导致UniSuper的服务宕机超过一周时间,从5月2日开始,50多万会员无法访问服务。还好UniSuper在其他云服务商那里还有数据备份,才避免了更严重的后果。

目前服务正在逐步恢复,但用户的账户金额停留在4月30日。

事件复盘

谷歌云对这次删库操作并没有像国内云服务商那样给出详细的复盘说明,只是与UniSuper发布了一个联合声明。谷歌在声明中称这是一次孤立的、独一无二的事件,并表示已经确定了导致这次中断的事件并采取措施确保不再发生。

UniSuper的CEO Peter Chen和谷歌云的全球CEO Thomas Kurian发表了联合声明,他们强调了即使是最先进的技术也可能出现意外的重要性,并表示已采取措施确保类似情况不再发生。

经验教训

作为一名运维人员,身处于重要岗位,你应该明白你的所有操作都应该合规、每个操作都要经过多重审批后进行,你的随意操作可能就会影响到无数用户、无数家庭的生活。

高可用性、多云跨云和多备份的重要性。一个错误的操作、一个未知的安全漏洞或一场意外的宕机都可能带来无法估量的损失。尤其本次事故更体现了备份的重要性,尤其是多重备份和跨平台备份。

谷歌云删库事件给业界敲响了警钟,提醒各位运维人员使用云服务时要谨慎操作,并加强备份措施以应对意外情况的发生。即使是大型云服务提供商也不可避免地会面临技术故障和人为失误,时刻保持警惕和采取适当的措施很重要。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多