您当前的位置:首页 > 互联网百科 > 云计算

阿里云 11.12 故障原因曝光

时间:2023-11-16 21:58:40  来源:OSC开源社区  作者:

针对阿里云 11.12 的重大服务故障, 该公司发给客户的一份「官方故障报告」昨天在网上被广泛流传。

事件回顾:阿里云严重故障,全线产品受影响(已恢复)

阿里云 11.12 故障原因曝光

影响范围

1、OSS、OTS、SLS、MNS 等产品的部分服务受到影响,大部分产品如 ECS、RDS、网络等运行不受影响。

2、云产品控制台、管控 API 等功能受到影响。

时间

2023 年 11 月 12 日 17:39~19.20,故障时间为 1 小时 41 分。

问题概况

2023 年 11 月 12 日 17:39 起,阿里云云产品控制台访问及管控 API 调用出现异常、部分云产品服务访问异常,工程师排查故障原因与访问密钥服务 (AK) 异常有关。工程师修订白名单版本后,采取分批重启 AK 服务的措施,于 18:35 开始陆续恢复,19:20 绝大部分 Region 产品控制台和管控 API 恢复。

处理过程

17:39:阿里云云产品控制台访问及管控 API 调用出现异常。

17:50:工程师确认故障是 AK 服务异常导致,影响云产品控制台、管控 API 调用异常,以及依赖 AK 服务的云产品服务运行异常。

18:01:工程师定位到根因。

18:07:开始执行恢复措施,包括修订白名单版本、重启 AK 服务。

18:35:杭州等 Region 开始恢复正常。

19:20:绝大部分 Region 的云产品控制台和管控 API 调用恢复正常。

原因

访问密钥服务 (AK)在读取白名单数据时出现读取异常,因处理读取异常的代码存在逻辑缺陷,生成了一份不完整白名单,导致不在此白名单中的有效请求失败,影响云产品控制台及管控 API 服务出现异常,同时部分依赖 AK 服务的产品因不完整的白名单出现部分服务运行异常。

改进措施

1、增加 AK 服务白名单生成结果的校验及告警拦截能力。

2、增加 AK 服务白名单更新的灰度验证逻辑,提前发现异常。

3、增加 AK 服务白名单的快速恢复能力。

4、加强云产品侧的联动恢复能力。

END



Tags:阿里云   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
阿里云史上最大力度降价背后:舍利润换规模,否认与华为打价格战
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦2月29日,疯狂星期四,阿里云宣布史上最大力度降价。在今日的2024战略发布会上,阿里云宣布全线云产品官网售价全面下调,平均降价幅度超过...【详细内容】
2024-03-01  Search: 阿里云  点击:(17)  评论:(0)  加入收藏
阿里云DDOS防御如何安装
阿里云DDOS防御是一种保护云服务器免受分布式拒绝服务(DDoS)攻击的重要工具。DDoS攻击是一种常见的网络安全威胁,它通过向目标服务器发送大量的请求来使其超负荷运行,从而使其无...【详细内容】
2024-01-17  Search: 阿里云  点击:(82)  评论:(0)  加入收藏
云服务2023:阿里云急转弯,腾讯云被集成,百度云加速赶
文|奇偶派回望2023年伊始,伴随着特殊时期的结束和国家数字化转型相关政策的落地,叠加以ChatGPT为代表AI新增量的出现,市场对中国云服务行业的表现普遍给予了较高的期待值,希望其...【详细内容】
2024-01-09  Search: 阿里云  点击:(40)  评论:(0)  加入收藏
阿里云盘关闭个性化推荐的方法
很多新手小伙伴还不了解阿里云盘在哪关闭个性化推荐,所以下面小编就带来了阿里云盘关闭个性化推荐的方法,有需要的小伙伴赶紧来看一下吧。阿里云盘在哪关闭个性化推荐?1、首先...【详细内容】
2023-12-14  Search: 阿里云  点击:(41)  评论:(0)  加入收藏
如何使用阿里云虚拟主机和域名设置网站?
本文档将向您展示如何使用阿里云虚拟主机来设置一个新网站,并完成一个域名。如果您按照此处的步骤操作,您将启动并运行一个新网站,可以使用您选择的名称在全球范围内访问,并托管...【详细内容】
2023-11-29  Search: 阿里云  点击:(178)  评论:(0)  加入收藏
阿里云 11.12 故障原因曝光
针对阿里云 11.12 的重大服务故障, 该公司发给客户的一份「官方故障报告」昨天在网上被广泛流传。事件回顾:阿里云严重故障,全线产品受影响(已恢复)影响范围1、OSS、OTS、SLS、MN...【详细内容】
2023-11-16  Search: 阿里云  点击:(112)  评论:(0)  加入收藏
对话阿里云CTO周靖人:“炼出”一个大模型应用,最快需要多久?
文 丨 新浪科技 周文猛在2023云栖大会上,阿里云宣布将升级云计算体系,打造一朵AI时代最开放的云。阿里云CTO周靖人在接受新浪科技《科创100人》采访时表示,模型已经成为业务系...【详细内容】
2023-11-03  Search: 阿里云  点击:(218)  评论:(0)  加入收藏
阿里云首席技术官周靖人:通义千问2.0将发布,AI技术快速变革影响生活方方面面
10月31日上午,在杭州西湖区云栖小镇国际会展中心,“2023杭州·云栖大会”正式开幕。主论坛上,阿里云首席技术官周靖人发表主题演讲。周靖人讲述阿里云发展历程,从2009年,阿...【详细内容】
2023-10-31  Search: 阿里云  点击:(127)  评论:(0)  加入收藏
阿里云通义千问宣布向全社会开放,近期将开源更大参数规模大模型
新浪科技讯 9月13日上午消息,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。通义千问在...【详细内容】
2023-09-13  Search: 阿里云  点击:(76)  评论:(0)  加入收藏
阿里云还会继续降价吗?
虽然在大多数时候,降价和利润通常站在对立面。但对云业务而言,降价往往会起到“以价换量”的效果——当云用户逐渐增加,分摊云成本的分母变多,成本降至足够低的时候,原...【详细内容】
2023-08-16  Search: 阿里云  点击:(60)  评论:(0)  加入收藏
▌简易百科推荐
生成式AI:云计算的关键之战
“美国有一家铁路公司,过去两年我们一直在交谈。终于,他们这次打电话给我们,希望迅速推进上云迁移。”近日,亚马逊云科技全球客户技术支持与服务副总裁Uwem Ukpong向记者谈及企...【详细内容】
2024-04-08    21世纪经济报道  Tags:云计算   点击:(6)  评论:(0)  加入收藏
云计算:数据存储与处理的革命性技术
当我们谈论“云计算”时,我们实际上在讨论的是一种基于互联网的新型计算模式。云计算允许用户通过网络访问并使用存储在数据中心(也称为“云”)的共享计算资源。这些资源可以包...【详细内容】
2024-03-04  徐文轩    Tags:云计算   点击:(18)  评论:(0)  加入收藏
云服务2023:阿里云急转弯,腾讯云被集成,百度云加速赶
文|奇偶派回望2023年伊始,伴随着特殊时期的结束和国家数字化转型相关政策的落地,叠加以ChatGPT为代表AI新增量的出现,市场对中国云服务行业的表现普遍给予了较高的期待值,希望其...【详细内容】
2024-01-09    奇偶派  Tags:云服务   点击:(40)  评论:(0)  加入收藏
云计算这一年:冰与火之歌奏响
©⾃象限原创作者丨程心在电影《奥本海默》中,当奥本海默第一次见证了原子弹的爆炸成功,巨大而刺眼的白光穿越了200英里的距离和层层防护,那一刻世界仿佛被抽离,人们见证了...【详细内容】
2023-12-26    自象限  Tags:云计算   点击:(40)  评论:(0)  加入收藏
为什么 Traefik 是云原生首选网关?
根据 Traefik Labs 团队对于 Traefik 在云原生生态中的定位:云原生反向代理和负载均衡器及网关解决方案。一、从生态拥抱视角看:Traefik 的发展前景从云原生生态视角来看,Traef...【详细内容】
2023-11-29  架构驿站  微信公众号  Tags:网关   点击:(66)  评论:(0)  加入收藏
2024年的云趋势:云计算的前景如何?
适应复杂的生态系统、提供实时功能、优先考虑安全性和确保可持续性的需求正在引领云计算之船。多样化的工作负载允许探索通用的公共云基础设施范例之外的选项。由于需要降低...【详细内容】
2023-11-23    千家网  Tags:云计算   点击:(69)  评论:(0)  加入收藏
基于云的应用设计和部署:综合指南
什么是基于云的应用?基于云的应用是设计在云计算环境中运行的软件应用程序。在这里,应用及其相关数据不在本地计算机上存储和执行,而是在云中托管和操作。基于云的应用运行在...【详细内容】
2023-11-23  千家网  微信公众号  Tags:   点击:(65)  评论:(0)  加入收藏
云平台存储应急演练常见问题分析
相比于传统架构成熟的应急处置体系,业界关于云平台存储开展应急演练和管理方面则稍显欠缺。本文将梳理云平台存储应急演练与传统IT架构的区别,列举云平台存储常见的故障场景,并...【详细内容】
2023-11-21    IT168  Tags:云平台   点击:(69)  评论:(0)  加入收藏
阿里云 11.12 故障原因曝光
针对阿里云 11.12 的重大服务故障, 该公司发给客户的一份「官方故障报告」昨天在网上被广泛流传。事件回顾:阿里云严重故障,全线产品受影响(已恢复)影响范围1、OSS、OTS、SLS、MN...【详细内容】
2023-11-16    OSC开源社区  Tags:阿里云   点击:(112)  评论:(0)  加入收藏
云计算的五个网络要求
网络和云团队应该在其云策略中考虑带宽和延迟优化、安全性、网络冗余、服务质量和网络自动化等因素。云计算和SaaS架构的出现颠覆了整个IT行业,并扩展到了网络领域。能够从世...【详细内容】
2023-11-14    千家网  Tags:云计算   点击:(69)  评论:(0)  加入收藏
站内最新
站内热门
站内头条