文|李佳师
云计算依然高速增长。最近,亚马逊、微软、谷歌公布了最新的财报,各家云业务收入均实现了两位数的大幅增长,其中亚马逊AWS营收同比增长29%,谷歌云营收与去年同期相比增长43%,微软智能云服务同比增长了17%。在云计算收入高歌猛进的同时,这些云计算巨头企业都纷纷加大了对超级数据中心的布局和投入,展开云计算超级数据中心的“军备大竞赛”。
近期全球新增了多座超大规模数据中心,来自Synergy Research Group的最新数据显示,截至第二季度末,超大规模商运营的大型数据中心总数增至541个,是2015年年中数字的两倍多。按照市场研究公司Dell'Oro Group预计,未来5年全球数据中心的资本支出将超过2000亿美元。
超级数据中心是IT技的集大成者,但数据中心并不是越大越好,从选址到能耗,从灾备到运维等,从硬件到软件,从“芯”到“云”,这背后有大量的技术,影响着各巨头的成本、效率,影响着各家的云竞争力。在这场云计算核心生产力的军备竞赛中,谁的数据中心“技术含金量”高,谁就有可能在这场IT比赛中拔得头筹。亚马逊、微软、谷歌、阿里都有各自的看家本领,并且动作频频。
亚马逊AWS、微软Azure与阿里云Alibaba cloud被国外媒体称为“3A”。虽然阿里云与亚马逊、微软在营业收入上尚有一定距离,但其增速非常快,在2015财年,阿里巴巴首次披露云计算营收,当年阿里云收入为12.71亿元;到2020财年,这一数字在6年间增长31倍,目前,阿里云已经成长为全球排名第三、中国排名第一的云服务商。7月份高盛在最新评估中上调阿里云估值至930亿美金。根据Canalys数据,2020年一季度全球云计算基础设施支出同比增长34.5%,达到310亿美元,其中AWS和微软分别排名第一和第二,谷歌云和阿里云并列第三。
接下来我们分析对3A在超级数据中心上展开的“具备竞赛”进行详解,解密各家正在进行的相关布局。
微软
几天前微软宣布已成功测试了氢燃料电池(250千瓦),用氢燃料电池给数据中心的一排服务器连续供电48小时,效果良好。目前微软正在考虑将氢燃料电池作为柴油发电机的替代品用于数据中心电网供电中断时的备用电。如果水制氢技术能够成熟实现规模化,未来就有可能成为名副其实的“终极能源”,因为氢来源广泛,氢燃料将取之不尽,用之不竭。微软计划到2030年实现零排放,并消除对柴油的依赖。为了这个宏大的目标,其布局在全球各地的超级数据中心能耗能否降下来,当然是大头。
能源一直是超级数据中心的“成本巨头”,数据显示全球数据中心去年的耗电量占总用电的1.5%,约为400亿万瓦,相当于法国一年总用电量。为了降低成本,微软将其在美国的数据中心大多建在了电力成本便宜的地区。如位于美国西雅图东150英里昆西的微软“哥伦比亚数据中心”,这个占地超过40个足球场大小的数据中心,之所以选择昆西,就是因为这里位于美国最大的水电站大古力水坝附近,有最充沛的水电网络供电。
为了提升效率降低能耗,微软除了自研氢燃料电池,微软另一个大的举动是将数据中心布局到海底。2016年,微软在加利福尼亚海岸测试其原型水下数据中心,而这一探索的意义在于,海底有更多的可用土地、大量的潮汐能、更好的冷却效果以及与大量的海底光缆。微软CEO萨提亚去年年底表示,目前全球有50%的人口靠近水体,所以水下数据中心将在微软全球云计算平台扩展方面发挥重要作用。
不仅仅是在选址、能源方面有大量的探索,微软在数据中心技术架构上进行了大量的创新,包括2010年率先基于FPGA进行底层技术的深度研发,开启了FPGA在互联网/软件公司的大型数据中心实质性应用的先河,拉开了全球云计算巨头数据中心采用FPGA进行深度优化的序幕,现在微软是英特尔FPGA的最大用户。
目前围绕超级数据中心、围绕2030年实现零排放,微软还在路上。不久前微软中国CTO韦青在接受记者采访时透露,微软不仅仅是自身在联合诸多跨学科领域进行跨界研究,而且正在协同上线下游产业链一起前行。
阿里云
7月31日,阿里云宣布其南通、杭州、乌兰察布三座超级数据中心落成,截至目前,阿里云在全球22个地域部署了上百个云数据中心,其中规划建设了5座超级数据中心,分别位于张北、河源、杭州、南通和乌兰察布,而这样的布局,有的是满足“清洁能源诉求”,有的是遵循“资源近客原则”,这样的布局逻辑,能够使得在中国从南到北的从东到西的客户都能够充分享受到更优、质量更高的云服务。未来阿里还将在全国再建10座超级数据中心,阿里加入云巨头全球超级数据中心大竞赛。
据阿里巴巴IDC研发事业部总经理高山渊透露,阿里的超级数据中心应用了达摩院、平头哥等最新研究成果,在规模、算力、节能、智能化方面都是一次全面升级。阿里云五大超级数据中心均部署了自研架构的神龙云服务器,突破了困扰云计算行业的虚拟化损耗,性能达到全球最高水平。同时,阿里巴巴自研的AI芯片含光800也在上述超级数据中心大规模部署,在AI推理场景下,含光800的性能和能效比均为全球第一。
在针对超级数据中心的几大核心难题:包括大规模供电、高带宽数据传输以及高效率制冷、运维等方面,阿里云自研了一系列硬核技术已经在5大超级数据中心全面应用。
在供电技术方面,传统的数据中心通常采用高压配送电,其中的难点是如何将10kV的AC供电转为240V的DC供电同时控制相应损耗,阿里对磁路和电路进行联合设计,提出最高2.5MW、一体化、模块化、高效、高可靠直流不间断电源,省去传统低压配电环节,采用第三代半导体技术大幅度优化电源内部结构,实现了高可靠和低成本的目标。阿里将自研的供电方案命名为“巴拿马”就是希望它像连接大西洋与太平洋的巴拿马运河一样能够提升效率降低配送电的损耗。
此外在节能技术方面,阿里的5大超级数据中心还广泛使用了液冷、水冷、风能等节能技术。散热一直是超级数据中心的耗能“头号杀手”,而在传统数据中心里,几乎有一半的电能消耗在了散热上,此次新建成的杭州数据中心就部署了全球最大的液冷服务器集群,通过将服务器“泡”在一种特殊的冷却液里,使得全程用于散热的能耗几乎为零,这个方式能够为数据中心节能70%以上。
硅光模块是阿里超级数据中心的另外一个硬核科技,去年年底阿里推出基于硅光技术的400G DR4光模块,其带宽密度提高4倍,网速提升4倍,设备体积与成本基本没有增加,目前400G光模块同样已在阿里的各大超级数据中心全面投入使用。
应该说,超级数据中心是新技术集大成,它的不断突破不仅仅需要云计算企业,还需要大量的产业链上下游企业一起参与,目前阿里已经把大量的数据中心创新技术拿到ODCC上进行开源,这意味着更多的企业可以共享阿里的技术、阿里的实践与积累,参与到这场超级数据中心的大创新中来。
亚马逊
今年以来亚马逊不断加速其全球数据中心的布局,其位于澳大利亚昆士兰、南非开普敦以及美国弗吉尼亚等多地数据中心相继开张。来自Synergy Research Group的数据,亚马逊AWS与谷歌是过去12个月以来增加超级数据中心最多的两个企业,这与其业务今年仍实现29%增长有关。
几天前,亚马逊宣布将在爱尔兰Charlemont Square地区新建一个数据中心园区。根据计划,该数据中心园区占地约15800平方米,预计于2022年开放使用,而且亚马逊位于爱尔兰地区的首个风电场项目也即将上线,有可能新的数据中心将其引入风电进行供电,从而为2025年实现100%可再生能源承诺,以及2040年完成净零碳目标迈进。该风电场也成为亚马逊在美国以外运营的首个可再生能源项目。
为了进一步提升云的效率,亚马逊AWS也加入了芯片设计的赛道,希望通过自研芯片获得从芯到云的极致效率,近日,亚马逊AWS宣布,第六代弹性计算服务AWS C6g现在开放服务,其主要是面对计算密集型工作负载,采用的是其自研的Graviton 2处理器。AWS表示,Graviton 2的性能是第一代芯片的7倍,内存的访问速度则是此前的5倍。
在今年举行的亚马逊AWSre:Invent大会上,亚马逊透露了其利用5年时间对其数据中心的生态进行了自上而下的整改,其中包括了网络提速降成本,目前计算成本不断下降,但网络成本一直急速上升,为了改变目前的状态,亚马逊与网络设备厂商签订了定制采购合用,亚马逊希望为其数据中心定制开发,采用新的网络协议,以减少网络层次体系和网络延迟。不仅如此,亚马逊还希望缩短客户与网络之间的延迟,在各个地区之间铺设专用光纤,缩短延迟希望地区之间的延迟低于2毫秒等。亚马逊宣布将制造专有的网络设备、服务器、芯片、机架等等。
围绕数据中心的竞争是一场没有完结的竞赛,如果说云计算是数字经济时代的 “水和电”,那么超级数据中心就是生产“水和电”的超级工厂。在这些超级工厂里,从芯片到系统,从硬件到软件,从能源到散热,从网络传输到灾备,从选址到自动化运维,需要大量的智慧、大量的黑科技。而到目前为止,包括微软、亚马逊、阿里云等每一家厂商所选取创新维度、创新路径,都不一样,究竟最后谁能够真正拔得头筹?现在下结论还为时尚早,时间会给出答案。