您当前的位置:首页 > 互联网百科 > 云计算

宕机时间少七倍,揭秘AWS基础设施的运维之道

时间:2020-12-18 11:01:30  来源:  作者:

从2006年8月份正式开通云服务,到2020年第三季度收入达到116亿美元,同比增长29%,年化收入达到460亿美元。AWS营收规模在一个IT产业史上堪称神话,这背后数据中心等基础设施功不可没。如果没有强大的数据中心作为支撑,为全球数以万计用户提供各种各样云服务,AWS不可能连续多年保持如此惊人的增长速度。

一直以来,AWS的数据中心无论是数量、规模、设计、运营都充满神秘感,外界对其是知之甚少,也是业界众多伙伴十分感兴趣的。在今年的AWS re:Invent大会上,AWS 全球基础架构和客户支持资深副总裁 Peter DeSantis甩出诸多干货,详细介绍了AWS的数据中心在面向全球服务众多用户是如何做到稳定、定制和环保的。

任何设备都会坏

数据中心等基础设施是云服务商的核心命脉,由于大部分云服务商随着业务的增长,其数据中心的规模和设备数量也会随之膨胀,带来的就是数据中心故障和宕机风险的增长。AWS作为全球云计算巨头,其数据中心规模无出其右,它又是如何看待风险以及解决风险的。

“不要去回避各种故障,因为任何设备都会坏,你需要做的就是预测什么时候坏,并且做好准备。”--这就是AWS在数据中心基础设施运营和维护的核心原则。也正是在这个原则的指导下,AWS一年的平均宕机时间比2018年规模次大的云端供应商少七倍之多。

宕机时间少七倍,揭秘AWS基础设施的运维之道

 

面对规模如此之大、复杂性如此高的数据中心基础设施,AWS的首先思路就是降低各种设备的复杂性,比如发电机组的配电系统和UPS,这些都是传统厂商生产的通用型产品,往往拥有丰富的功能和极高的复杂性,“部件越复杂的东西意味着坏的概率就越大。配电系统的控制系统是嵌入式系统,非常复杂,很多功能其实并不是AWS所需要的。” AWS大中华区产品部计算与存储总监周舸介绍道。

为此,AWS的思路就是降低产品的复杂性,既符合自身业务需求,又提升了运维的简易性。比如,AWS针对自身情况做了一套控制器系统,一旦有问题发生,可以马上进行修改,做到尽量不影响到用户业务;又如,AWS将数据中心UPS电池做小,通过自己的软件来控制UPS,当每个单元设备出现问题时,其所带来的麻烦也下降很多。

除了数据中心部件级的运维之外,AWS对于整个地理区域的可用区都有着全面的保护机制。据悉,AWS 细分地理区域和可用区(AZ),这与其他云提供商有很大不同:首先,远距离的可用区设置,可以降低自然灾难(火灾,水灾…)带来的业务中断风险;其次,用户选择最近站点接入以低延迟访问AWS云资源;第三, AWS分别管理每个区域中的运维,将故障分割;

“从最小的零件,到整个可用区的架构,AWS是一层层思考如果发生了故障或者宕机会给用户带来哪种影响,并且尽量不影响到用户的业务。”周舸补充道。

定制芯片,让数据中心发挥极致

在数据中心等基础设施中,芯片担当着计算的重任,对于整个数据中心的能耗、效率、性能、运维等都有着重要影响。同样,AWS在针对不同应用和需求定制芯片上也在持续发力,持续打造数据中心的极致能。

在AWS Nitro方面,已经成为数据中心物理资源的一个抽象层,AWS 云平台通过 AWS Nitro 控制器向 Amazon EC2 添加网络,存储和安全资源。今年,Nitro已经成功发展到第四代。

在刚刚推出的Amazon EC2 mac计算实例中,就是AWS通过在在 Mac Mini 上安装了 Nitro Controller,没有 Hypervisor 的Nitro Controller可以安全快速地连接到 Mac Mini。那些为iphone、iPad、Mac、Apple Watch、Apple TV和Safari开发应用的开发人员,可以通过使用EC2 Mac实例,在几秒钟内配置和访问macOS环境,根据需求动态扩展容量。

宕机时间少七倍,揭秘AWS基础设施的运维之道

 

AWS Graviton 是基于 ARM 的芯片组,今年推出了AWS Graviton 2作为通用处理器;高性价比的 AWS Graviton 2 不仅可以很好地处理前端工作负载,对于 IO 密集型工作负载也很友好。

事实上,当前芯片处理器已经发展到一个十字路口,最近几年以来,芯片处理器能力的提升一直不太明显,芯片频率提升在减慢,取而代之的是芯片核心数在不断提升,处理器走向并行处理的趋势明显。

“有三个条件在影响多核处理器的发展。首先是多核操作系统;其次是多核应用程序;另外一个就是微服务。2015年之后,容器、无服务等微服务化发展迅速,微服务将工作负载切分的很细,这就对计算资源要求很细,特别是和多核架构。”周舸透露。

现在传统处理器因为需要兼容传统工作负载,所以芯片越做越大、越来越复杂,增加了很多功能,比如SMT多线程控制组件,SMT虽然可以多个线程共享和共用计算资源,但也会带来工作负载不平衡、性能容易受影响以及安全隐患等问题。“Graviton 2这样的多核处理器就能很好地解决这些问题。”周舸表示。

可再生能源,让数据中心走向环保

有人统计,目前全球数据中心的电力消耗总量已经占据了全球电力使用量的百分之三,到2025年,全球数据中心使用的电力总量按现在的电力价格来估算的话,将会超过百亿美元,年均复合增长率将达到6%。随着全球数字化脚步的提速,未来对于超大型数据中心的需求也上升。AWS作为超大型数据中心的运营者,其对于数据中心走向环保的步伐正在持续加速。

环保,也是今年 Peter DeSantis在re:Invent大会上演讲的一个核心议题。

据悉,AWS 致力于以尽可能环保的方式运营业务,并实现全球基础设施 100% 使用可再生能源。AWS 正朝着到 2025 年 100 % 利用可再生能源的道路前进,比其最初的 2030 年目标提前了五年。

宕机时间少七倍,揭秘AWS基础设施的运维之道

 

为此,AWS 用多项举措来提高用水的效率,减少用于冷却数据中心的饮用水的使用。AWS 通过评估每个 AWS 区域的气候模式、当地水资源管理和可用性以及保护饮用水水源的机会来制定用水战略。

此外,亚马逊宣布了五个新的公用事业规模的太阳能项目,为中国、澳大利亚和美国的全球业务提供电力,一共增加 615 MW 再生能源发电能力,预计每年发电 120 万 MW。

2020 年亚马逊对可再生能源的总投资项目已达到 35 个,装机容量超过 4 GW,这也是目前世界上单一企业在1年内对可再生能源的最大的一笔投资。这些新项目将使亚马逊所拥有的可再生能源的的总装机容量在 2020 年达到 6.5 GW,并成为有史以来最大的企业可再生能源采购商。

事实上,AWS对于数据中心环保的投入,不仅仅是对于自身成本的一直控制,更是践行环保理念的责任体现。面向未来,AWS在数据中心基础设施领域的建设理念必然会影响到全球更多用户和同行,为基础设施发展带来全新的思考。



Tags:AWS   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
在今天上午召开的 AWS re:Invent 会议上,亚马逊宣布以预览版的形式推出“AWS Private 5G”。这项新服务皆在使部署和管理自己的私人网络变得容易,解决企业在利用 5G 方面面临...【详细内容】
2021-12-01  Tags: AWS  点击:(21)  评论:(0)  加入收藏
从2006年8月份正式开通云服务,到2020年第三季度收入达到116亿美元,同比增长29%,年化收入达到460亿美元。AWS营收规模在一个IT产业史上堪称神话,这背后数据中心等基础设施功不可...【详细内容】
2020-12-18  Tags: AWS  点击:(110)  评论:(0)  加入收藏
【环球网科技报道】我们正在经历怎样的计算时代?AWSCEO 安迪·杰西(AndyJassy)看来,计算正不断被重塑。“传统的人们运行计算的方式都是通过设备、知识应用或者计算资源,现...【详细内容】
2020-12-10  Tags: AWS  点击:(88)  评论:(0)  加入收藏
今天来给大家介绍一下使用AWS的免费工具申请SSL证书,以下各部分将讨论如何使用 AWS Certificate Manager (ACM)控制台来请求公有 ACM 证书。请求公有证书登录 AWS 管理控制台...【详细内容】
2020-08-21  Tags: AWS  点击:(66)  评论:(0)  加入收藏
本文由 Xavier Lefèvre 发表在 medium.com,经原作者授权由 InfoQ 中文站翻译并分享。Lambdas 如此吸引人有两个原因:自动缩放功能(扩容、减容)以及按使用量计价的模型。...【详细内容】
2020-08-09  Tags: AWS  点击:(62)  评论:(0)  加入收藏
AWS和AZURE之间的区别亚马逊网络服务(AWS)是亚马逊的一个云服务平台,提供不同领域的服务,如计算、存储、交付和其他功能,帮助业务规模和增长。我们可以以服务的形式利用这些域...【详细内容】
2020-08-08  Tags: AWS  点击:(238)  评论:(0)  加入收藏
今天,企业信息化市场的大部分“江山”,已经属于云计算。尤其在疫情到来之后,企业加快数字化转型的第一个步骤,就是推动应用上云进程。但是,你知道吗?云计算最原始应用起源于AWS! ...【详细内容】
2020-08-07  Tags: AWS  点击:(73)  评论:(0)  加入收藏
导读:随着国际云市场竞争越来越激烈,以中美贸易战为导火索,越来越多的国内AWS客户开始从AWS搬迁至阿里云。本篇文章作为系列文章开篇,从整体分析AWS/阿里云产品差异分析,希望能给...【详细内容】
2020-07-17  Tags: AWS  点击:(98)  评论:(0)  加入收藏
要说目前软件架构中热度十二分的话题,当属Serverless。通常我们会将其翻译为“无服务器架构”。尽管成天被称为“无服务器”,但该架构与传统架构不同,显然并不是真的不需要服务...【详细内容】
2020-06-27  Tags: AWS  点击:(49)  评论:(0)  加入收藏
在经过11年的培育成长后,阿里云终于迎来商业的最高光时刻。5月22日晚间,阿里巴巴披露2020财年业绩,并重点披露了阿里云财年收入达到400.16亿元,估值也达到770亿美元。阿里云这...【详细内容】
2020-05-23  Tags: AWS  点击:(44)  评论:(0)  加入收藏
▌简易百科推荐
作者:阿里集团 阿里云智能事业群 云原生应用平台来源:华章科技 云原生(Cloud Native)的概念,最早是由Pivotal于2015年提出的,但是即使到了2019年上半年,国内对其的关注依然相对有限...【详细内容】
2021-07-19  华章科技    Tags:云原生   点击:(182)  评论:(0)  加入收藏
一、案例概述为了方便对公司办公计算机桌面系统的管理,公司需要搭建一套桌面虚拟化平台。公司运维工程师决定使用Cirtix桌面 虚拟化解决方案。 Citrix XenServer服务器虚拟化...【详细内容】
2021-07-13  虚拟化爱好者    Tags:企业云   点击:(609)  评论:(0)  加入收藏
近日有粉丝问阿里云和华为云的部署区别是啥,其实阿祥没有搭建过阿里云,具体用啥工具部署,部署的步骤和具体方法并不知道(ps:后续如果能找到类似资料,阿祥会给大家分享),所以我这次先...【详细内容】
2021-07-13  信息系统集成Vlog    Tags:阿里云   点击:(136)  评论:(0)  加入收藏
人类社会可以划分为三个阶段:第一次浪潮为农业阶段,从约1万年前开始;第二阶段为工业阶段,从17世纪末开始;第三阶段为信息化阶段,从20世纪50年代后期开始。 --托夫勒,《第三次浪潮...【详细内容】
2021-06-02  云技术    Tags:云计算   点击:(95)  评论:(0)  加入收藏
题目:请输入星期几的第一个字母来判断一下是星期几,如果第一个字母一样,则继续判断第二个字母。程序分析:用情况语句比较好,如果第一个字母一样,则判断用情况语句或if语句判断第二...【详细内容】
2021-05-14    全国产经平台  Tags:云计算开发   点击:(128)  评论:(0)  加入收藏
在当今互联网行业乃至一些大厂,大部分公司都采用敏捷项目管理模式来管理项目,在敏捷十二条宣言中有一条是这样说:“我们的最高目标是,通过尽早和持续地交付有价值的软件来满足...【详细内容】
2021-04-30    云计算AND容器技术  Tags:Jenkins   点击:(165)  评论:(0)  加入收藏
云服务所谓的云服务,云服务可以将企业所需的软硬件、资料都放到网络上,在任何时间、地点,使用不同的IT设备互相连接,实现数据存取、运算等目的。 云服务是一种按需服务1.云服务(C...【详细内容】
2021-04-28  德姐姐科普  今日头条  Tags:云服务   点击:(155)  评论:(0)  加入收藏
云计算是一种基于互联网的计算新方式,使得个人和企业用户以按需即取、易扩展的方式的获取计算和服务。本文介绍了云计算的基本概念、发展历程及发展现状,总结了云计算的关键技...【详细内容】
2021-04-28  云计算那点事    Tags:云计算   点击:(109)  评论:(0)  加入收藏
图片来源@视觉中国文 | 波波夫上世纪六十年代,科学家John McCarthy在斯坦福大学提出了“从任意地点通过网络访问计算机程序”的设想时,台下听众的反应,可能和今天在推特上看马...【详细内容】
2021-04-16    钛媒体APP  Tags:云计算   点击:(102)  评论:(0)  加入收藏
由于边缘计算能让用户在靠近物或数据源头的一侧处理工作负载,极大地提升了在云端的处理效率,因此备受用户青睐。  根据MarketsandMarkets数据分析显示:到2022年,边缘计算市场...【详细内容】
2021-04-07    IT168企业级  Tags:边缘计算   点击:(139)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条