阿里云出现大面积系统故障 官方回应:系运维操作失误
- +1 你赞过了
6月27日下午,有大量用户反映阿里云控制台访问出现问题,用户账号无法登陆,图片服务无法使用。同时,阿里云官网的部分管控功能、MQ、NAS、OSS(对象存储)等产品的部分功能也出现无法访问异常现象。
28日,阿里云官方回应,“我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题,引发了大量吐槽。”
据悉,故障从2018年6月27日16:21开始,持续近30分钟时间,16:50开始陆续恢复。
作为中国最大的公有云厂商,阿里云占据了近50%的市场份额,用户已经突破100万。因此,一旦阿里云出现故障,很多公司业务将受影响。
至于事故发生原因,阿里云称,“工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。后续人工介入后,工程师团队快速定位问题进行了恢复。”
对于此次事故,阿里云表示,“没有借口,我们不能也不该出现这样的失误!我们将认真复盘改进自动化运维技术和发布验证流程,敬畏每一行代码,敬畏每一份托付。”
最新资讯
热门视频
新品评测