2018年终盘点之云宕机事故 主流云厂商纷纷“中弹”
- +1 你赞过了
6. 微软 Azure 爱尔兰数据中心宕机
时间:6月17日
宕机时间:5小时以上
事故详情:6 月 17 日至 18 日,因爱尔兰数据中心的恒温系统出现问题,微软 Azure 被高温影响导致存储和网络中断。
7. 阿里云故障
时间:6月27日
宕机时间:30分钟,恢复时间花费1小时左右
事故详情:6 月 27 日 16:21 左右,阿里云出现重大技术故障,16:50 分开始陆续恢复,官方给出的故障时间为 30 分钟左右,恢复时间大概花费一小时。经过技术复盘,阿里给出的故障原因为工程师团队上线自动化运维新功能时,执行了一项变更验证操作,该操作在测试环境中未发生问题,上线后触发未知 bug。
补救措施:人工介入,定位并解决问题
8. AWS宕机致使亚马逊网站瘫痪
时间:7月16日
宕机时间:持续近6小时
事故详情:7月16日是亚马逊会员日,即Amazon Prime Day。但是,在第四届亚马逊会员日开幕的几分钟后,亚马逊网站及 App 就同时发生严重宕机,不光电子商务业务受损,亚马逊的其他产品和服务都受到了不同程度的影响。亚马逊对此给出的解释是 AWS 管理控制台出现全球性问题。
9. 谷歌云宕机
时间:7月17日
宕机时间:不清
事故详情:7月17日下午,谷歌云宕机致使Spotify和Snapchat等热门应用服务中断。谷歌称,宕机影响谷歌应用开发平台Google App Engine、Cloud Networking和Stackdriver,后者旨在为公有云用户提供绩效与数据诊断服务。之后,谷歌发布一项更新,称该事件导致的502问题在下午1:05得到解决。
10. 腾讯云云硬盘故障
时间:7月20日
事故详情:8月5日,北京清博数控科技有限公司(以下简称“前沿数控”)在官方微博发布了一篇题为《腾讯云给一家创业公司带来的灾难》的博文,文中表明,2018 年 7 月 20 日,腾讯云云硬盘发生故障(腾讯云后期给出的事故原因说明),导致该公司存放的数据全部丢失,并且不能恢复,这是该创业公司近千万元级的平台数据,包括经过长期推广导流积累起来的精准注册用户以及内容数据。
补救措施:腾讯云表示,监控到异常后第一时间向用户告知了故障状态,并立即组织文件系统专家并联合厂商技术专家尝试修复数据。但经过多方努力,最终仍有部分数据完整性校验失败。
最新资讯
新品评测