导读:11月27日,阿里云部分控制台访问出现异常,经过紧急处理,访问异常问题已恢复,这已经是阿里云本月第二次控制台服务异常。北京时间11月27日
11月27日,阿里云部分控制台访问出现异常,经过紧急处理,访问异常问题已恢复,这已经是阿里云本月第二次控制台服务异常。
北京时间11月27日,阿里云部分地域云数据库控制台访问出现异常。据悉,从当日09:16起,阿里云监控发现北京、上海、杭州、深圳、青岛、香港以及美东、美西地域的数据库产品(RDS、PolarDB、Redis等)的控制台和OpenAPI访问出现异常,实例运行不受影响。经过工程师紧急处理,访问异常问题已于当日10:58恢复。
此次受影响产品包括,云原生数据仓库AnalyticDB PostgreSQL版、图数据库、云原生内存数据库Tair、云数据库Redis版、云原生关系型数据库PolarDB、云数据库专属集群、云数据库MySQL版、云原生数据仓库AnalyticDB MySQL版、云原生分布式数据库PolarDB-X、云数据库ClickHouse、云原生多模数据库Lindorm、云数据库PostgreSQL版、云数据库SQL Server版、云数据库MongoDB版、云数据库HBase版、数据库自治服务、数据库备份。
受影响地域包括,华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、华北1(青岛)、中国香港、美国(硅谷)、美国(弗吉尼亚)。
值得关注的是,这已经是阿里云本月第二次控制台服务异常,首次异常是在双 11 结束的一天后(11 月 12 日),涉及到阿里云盘、淘宝、咸鱼、钉钉、语雀等产品,持续时长约 3.5 小时。
当时,该消息迅速在网络发酵,引发外界热议,相关话题也随之冲上热搜。对此,有网友表示,是开屏跳转整太多带来的后遗症,双11支撑了这么大的业务系统,崩是正常的,不崩是不正常的。
值得注意的是,除C端产品外,公司的B端客户也受到不小影响。有媒体指出,波及范围在阿里系历史上实属罕见,受影响地域包括中国内地、中国香港,以及印度、美国、英国、韩日等多个国家和地区。天眼查数据显示,阿里云的企业用户超过300万家。这些客户因为云服务不可用,业务运营可能全面瘫痪。
作为上述产品及企业背后的云服务商,阿里云也在后续发布公告称,当日(11月12日)17:44起,阿里云监控发现云产品控制台访问及API调用出现异常,阿里云工程师正在紧急介入排查。目前,工程师通过分批重启组件服务,绝大部分地域控制台服务已恢复访问。
据阿里方面消息,(11月12日)19:20左右,经工程师紧急处理,阿里旗下淘宝、钉钉、阿里云盘等APP已全面恢复。随后于21:11,受影响云产品均已恢复,因故障影响部分云产品的数据可能存在延迟推送情况,不影响业务正常运行。
此外,近年来阿里云也曾多次出现服务异常。
2018年6月,阿里云曾出现持续近半小时的重大技术故障,彼时,阿里云官方对外解释称:“我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题。”
据新京报,2019年3月3日凌晨,有网友在微博上称阿里云疑似出现了宕机事故。而这也让华北不少互联网公司受到波及,APP和网站全部瘫痪。对此,阿里云方面回应称,经紧急排查处理后逐步恢复服务。针对本次故障,阿里云将根据SLA协议(服务合同),尽快处理赔偿事宜。
2022年12月18日,阿里云再次爆发香港Region可用区C大规模服务中断事件,导致多个香港及澳门站点受到影响。阿里云官方也对此坦言:“这对很多客户的业务产生重大影响,也是阿里云运营十多年来持续时间最长的一次大规模故障。”
至此,5年3次大事故,阿里云还未来得及喘息,便又面临了此次全系闪崩事件,相关业务出事频率也从5年3次上升至6年5次。