阿里云回应访问故障:运维操作失误导致,将敬畏每一行代码!阿里云再次对6月27日下午发生的技术问题进行了回应和解释,称“对于故障,没有借口。”
6月27日下午,有网友反映,登陆阿里云控制台时出现异常,部分服务无法正常使用。随后阿里云在官网发布公告称,阿里云的部分产品及账号登陆出现访问异常,截至当天下午17:30大部分受影响的业务已经恢复正常。
阿里云在最新的说明中介绍,故障发生在6月27日16:21左右至16:50,受影响的范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。
经过技术复盘,故障发生的原因是,当天下午工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中未发生问题,上线到自动化运维系统后,触发了一个未知代码Bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。
阿里云称,将认真复盘改进自动化运维技术和发布验证流程,“敬畏每一行代码”。