服务器可以消耗现代数据中心一半以上的能源,这使得服务器效率对寻求实现碳中和可持续发展目标的公司具有吸引力。另外,减少能源使用可以节省资金。
为了帮助实现这一目标,根据Uptime Institute最近的研究,以下是提高服务器效率的5种方法,该研究所的重点是提高关键业务基础设施的性能、效率和可靠性。
升级到新一代服务器。几十年来,服务器的能源效率一直在不断提高,这要归功于为其提供动力的处理器效率的提高。
选择具有高计算能力(以每秒事务数衡量)的服务器。这些是最节能的。
选择高核心数。一般来说,效率随着核心数量的增加而提高,尽管在最高端会有一些逐渐减少。
需注意,虽然服务器可以更加节能,但其实际总功耗可能会随着其效率的增加而增加。
通过两种方式实现电源管理功能:随着利用率的增加降低核心CPU电压和频率,以及将不需要的核心移至空闲状态。
在其分析中,Uptime重点关注使用AMD EPYC或Intel Xeon处理器的服务器,并使用Green Grid的SERT数据库中的数据检查了2017年、2019年和2021年的各代服务器。
Uptime Institute可持续发展研究总监Jay Dietrich表示,传统服务器的能源效率低于新服务器。例如,根据其最近与人合著的一份报告,在2017年至2019年间,CPU利用率为50%时,英特尔服务器的效率提高了34%。其表示,基于AMD的服务器性能提升了140%。
从2019年升级到2021年,基于CPU的服务器将使英特尔服务器的效率提高32%,AMD服务器的效率提高47%。效率的提高涵盖了各个利用率水平。
在比较AMD和英特尔服务器时,英特尔服务器在2017年的各个CPU利用率水平上都更加高效,但自2019年以来,AMD已经领先。2021年服务器的利用率为50%,AMD服务器的平均效率比英特尔服务器高74%。
就像汽车在交通中空转一样,未满负荷运行的服务器只是在浪费能源。
根据2022年Uptime Institute数据中心调查,只有47%的企业的服务器利用率达到50%或更高,而2020年为36%。Dietrich指出,这些数字可能有些夸大,因为做出回应的企业可能只报告了性能最佳的服务器,例如那些只运行批处理作业的服务器,这可能会将利用率提高到80%。
不过,由于许多应用的运行不一致,总体上的利用率可能会更低。例如,商业和企业软件在工作时间被大量使用,但下班后则少得多。通过让托管业务应用的服务器在非高峰时段运行时间敏感度较低的工作负载,可以提高服务器的利用率。
这些努力是值得的。Uptime表示,将低CPU利用率(20%至30%)提高一倍至更高水平(40%至60%),可以显着提高平均效率。
为了获得最大的影响,企业应该考虑提高利用率,同时将服务器升级到最新型号。根据Uptime的说法,将利用率的提高与服务器更新相结合,效率可以提高一倍以上。这意味着在相同的能量下处理的工作量增加了100%或更多。如果大规模实施,这可以节省大量资本和运营,降低能源需求,并提高可持续发展绩效。
另一方面,Dietrich表示,在不增加原有工作负载的情况下,直接用更高容量的服务器替换传统服务器,实际上会降低利用率,从而抵消了升级带来的一些好处。
这需要额外的计划来提高利用率,同时进行硬件升级,但结果不仅是提高效率,而且可能会减少服务器数量,因为所需的新机器数量可能会减少。
购买更强大的硬件也可以提高能源效率。特别是AMD服务器,随着服务器工作能力的增加,效率会大幅提高。从处理200万个SSJ的低端服务器升级到可处理超过800万个SSJ的高端服务器,可以使服务器效率翻倍。Uptime表示,对于英特尔服务器来说,仍然具有效率优势,尽管效果不那么显着。
另一种大幅提高效率的方法是增加处理器核心的数量。Uptime发现,在2021年的AMD服务器中,随着服务器核心数量从8个增加到64个,效率增加了两倍。对于英特尔来说,这一增幅较小,但对于2021年的机器来说仍然很显着。
Dietrich表示,值得注意的是,并非所有工作负载都能够使用所有可用内核。某些工作负载在12核处理器等设备上运行效率最高。因此,为了获得最高的效率,将处理器的能力与服务器上运行的应用的需求相匹配是非常重要的。
在某些情况下,可以使用虚拟机管理程序和虚拟机来最大限度地提高利用率,但并非所有应用都适合这些环境。
根据Uptime的研究,服务器的电源管理功能可以改善能源效率等式,将服务器效率提高至少10%。
其工作原理是可以增加或减少CPU电压和频率,并且未使用的核心可以进入低功耗空闲状态。然而,由于担忧性能或延迟问题,许多组织没有使用这些功能。
根据Uptime Institute的报告,电源管理会使延迟增加20到80微秒,这对于某些类型的工作负载来说是不可接受的,比如金融交易。
Dietrich表示:“在某些应用中,可以决定不使用,因为其会导致性能或响应时间问题。但还有其他应用,延迟不会对业务产生影响。“
“最大的错误是,一些运营商规避风险。他们认为,如果想在一台服务器节省几百美元的能源费用,但冒着违反SLA的风险,这将导致他们损失一百万美元,如此便不会使用电源管理。”
Dietrich建议,当企业购买新服务器并运行性能测试时,确保测试电源管理是否会对应用产生不利影响。如果没有影响,那么可以使用电源管理。且还可以实施一组电源管理功能,既能节约能源,又能提供客户想要的响应时间和性能。
Uptime使用Green Grid的服务器效率评级工具(SERT)数据库分析了429个服务器平台的效率。Green Grid是一个联盟,其目标是创建工具、提供技术专业知识并倡导数据中心环境中的能源和资源效率。
SERT套件是衡量服务器效率的行业标准;欧盟生态设计指令和美国能源之星计划制定的强制性服务器效率要求指定服务器报告SERT整体效率指标。
Uptime分析了SERT数据库中的AMD和Intel服务器数据,指出不同的处理器类型根据工作负载各有优缺点。Uptime重点关注使用AMD EPYC或Intel Xeon处理器的服务器,并分析了2017年、2019年和2021年的各代服务器。
该研究所通过模拟企业在线事务处理应用对服务器进行测试,该应用强调处理器和内存。该模拟是SERT工作集服务器端JAVA(SSJ)。Uptime表示,选择其的部分原因是SSJ数据可用于8个级别的服务器利用率,即12.5%、25%、37.5%、50%、62.5%、75%、87.5%和100%,这样可以进行更精细的分析。