4月9日,腾讯云宣布成立“星星海实验室”,这是腾讯历史上首个硬件工程实验室。官方称,成立星星海实验室是腾讯云面向产业互联网加速技术自研的重要战略,也是腾讯在自研之路上迈出的坚实一步,代表着腾讯对外技术输出进入新阶段。
星星海取名自青海省果洛藏族自治州玛多星星海,以水为名,寓意灵动与智慧。老子有云,“水利万物而不争”。腾讯云所希望实现的,正是借助于在云原生的先天条件,发挥软硬件一体化的技术优势,广泛联合服务器产业生态伙伴,为客户提供更适配云计算场景的服务器方案。
有人可能会好奇,腾讯云为什么会想到自研服务器?自研服务器与市场销售的工业标准服务器有哪些不同?对于使用云的用户来说,这种自研服务器的优势在何处?在解答这些问题之前,我们来看看传统服务器市场的状况。
从采购到自研:互联网大厂服务器需求的变迁
x86服务器成为市场主流也不过就是2000年之后的事情,在此之前的服务器市场更多是小型机的天下,性能高、售价贵、运维成本高也是小型机的典型问题。不过随着x86服务器在性能和通用性上的逐步提升,市场越来越多成为了通用服务器的天下。
不过那时候的服务器更多是采用了服务器厂商官方标准设计,尤其是许多品牌沦为了标准服务器的“中间商”,靠着赚差价实现盈利,因此这种行为也被形象的称为“搬箱子”。
当然这并非是行业常态。在搬过一段箱子之后,勤劳聪慧的中国人更可以从其中摸索出自己的生存之道。所以从2005年开始,许多国产服务器厂商也就开始走向了自研之路,从最初的外观、散热设计到后来的布局走线与局部模块化,最终也实现了服务器的自主设计。
但是这种设计依然是基于工业标准服务器所存在的,也是行业“万金油”。在任何行业、任何应用领域当中,主流的2U2P服务器都充当了“开路先锋”的作用,也在客观上推动了服务器市场进一步发展。
但是这种推动力并不是无穷无尽的。
慢慢大家发现,虽然这种服务器具备广泛的适应性,但是业务发展瞬息万变的云计算时代,显得过于“笨重”。因此,最先云化、使用服务器数量最多的互联网行业率先提出了服务器定制化的思路,并从外观到配置提供了专门化的需求。但是对于服务器厂商来说,这种变化是致命的,无论是昂贵的前期开模费还是后续的运维成本,都是对硬实力的考验,因此能够响应这种需求的厂商屈指可数。
由此也催动了互联网用户自主研发服务器的进程。大约从2012年开始,以BAT为代表的多家互联网大厂也开始着手研发适合自身业务需求与发展的服务器。说到底,这些企业选择自研服务器,无非就是基于两大理由——性能与灵活性。
咱们先来说性能。对于普通用户来说,可能十几上百台服务器就是应用的极限了,但是互联网大厂的服务器动辄就是上万甚至几十万台,因此每台性能的略微降低累积起来都是一个不得了的数字。更重要的是,由于互联网应用的特殊性,相当一部分新采购的服务器都要进行针对性的优化,或者需要进行部分配件的调整与革新,也就需要投入大量的人力、精力和财力,造成资源的浪费。
在上个月发布的腾讯财报中,腾讯云2019年全年营收超过170亿元,付费客户数突破100万。面对如此巨大的业务量和用户规模,自研服务器毫无疑问可以让腾讯云降低计算力的单位成本,并进而将这种成本红利释放给数百万的云上用户。
灵活性更是大厂们所看重的。我们经常会看到某个上架App下载火爆,紧急扩容的新闻,这背后则代表了成千上万台服务器的投入。但是往往这个时候,传统的服务器厂商需要漫长的响应时间和制造流程,难以快速满足需求。同时,面对瞬息万变的市场需求,服务器自身也需要进行针对性的设计,而这自然并非是传统企业的特长。
基于上述考虑,互联网大厂们更愿意结合自身需求,开发有针对性的服务器——那些需要性能的业务,就定制高规格的处理器和加速卡;那些负载高的数据库应用,就选择大容量内存;那些视频业务流,则需要对网络的进一步优化……用特性的服务器满足特殊应用,不知不觉就成为了互联网大厂们在长期实践中得出的共识。
腾讯云发力自研服务器:云原生与软硬一体化
自研服务器的路没有错,但是如何判定自研服务器的核心差异所在?是更低的成本、更适合的应用环境还是更灵活的升级潜力?都不是。至少在腾讯云看来,这些特性或许都很重要,但是面对云计算时代,自研服务器首先应该具备的,是基于云原生的软硬一体化能力。
在互联网高度发展的今天,你可以随时随地掏出手机与家人们微信视频聊天,分享生活的点点滴滴;也可以在闲暇时分邀三五位好友云端开黑,玩一盘《王者荣耀》;甚至你饿了叫外卖、出行订酒店等等日常行为,背后都有腾讯云在支持。
这些你意识不到的行为每天也产生和海量的数据,更对后端数据中心提出了巨大的数据处理和存储压力,也就必然需要强大服务器的支持。而这种强大所代表的,不仅仅是面向应用的优化或者针对业务的加速,而是基于云原生环境的“天生强大”。
腾讯公司副总裁、腾讯云总裁邱跃鹏
这种“强大”在腾讯云看来,关键词就是云原生和软硬一体化。在去年的腾讯开发者大会上,腾讯公司副总裁、腾讯云总裁邱跃鹏就详述阐述过“软硬件一体化”的优势。在他看来,软硬件一体化技术能够为开发者提供更强壮的基础设施平台,提升云计算的性能、提高资源利用率,最终为开发者提供稳定、更具性价比的服务。
为什么软硬件一体化如此重要?这还要从服务器本身的设计说起。一直以来,服务器都只是一个硬件设备,它必须借助于操作系统和软件才能够实现,而为了能够运行更多的软件,许多客户在购买服务器的时候还需要关注它的支持列表,不在列表范围内的设备不能够支持。很显然,这是已经不能满足当下云服务的需求。
也正是在腾讯开发者大会上,腾讯云发布了首款深度自研的服务器。作为迎合云计算场景的服务器产品,这款服务器自带的“云原生”属性就是针对虚拟化和容器等应用的高度适应性,这也恰恰是当下最主流的云平台基础。不仅如此,星星海服务器还在计算资源管理、云监控、热迁移等方面进行了软硬件一体化自动管理,使得管理者在运维方面不必再耗费更多的时间与精力。
在性能上,这款服务器也可以实现对应云服务实例星星海SA2云服务器综合性能提升35%,其中视频处理速度提升40%,图形转码得分提升35%,Web服务页面QPS提升高达152%。先进的热虹吸管散热技术实现最大负载能效对比业界可提高50%。同时,服务器具备的多CPU核心、超大缓存的特性,能够支持超大规格云主机实例,单台云主机性能峰值能够达到百万级QPS。
软硬一体化优势尽显。
星星海SA2云服务器,从自研业务适配到逐步开放
得益于云原生业务的特性,腾讯云首款自研服务器能够有效满足腾讯云98%应用场景需求。而自发布以来,星星海SA2云服务器已经经历了半年的内部业务应用。
年初,突如其来的新冠疫情席卷全球,也让在家办公成为了许多企业的必然选择,由此也推动了协同办公的增长。
腾讯会议的应用需求也激增,系统面临满载的风险。为此,从1月29日开始到2月6日,腾讯会议日均扩容云主机接近1.5万台,8天总共扩容超过10万台云主机,共涉及超百万核的计算资源投入。鲜为人知的是,本次腾讯会议扩容的100万核服务器资源全部由腾讯云星星海SA2云服务器提供支撑。
由于在软硬件系统上进行了自主研发设计外,还在芯片等关键部件上与供应链企业进行了深度定制,有效提升了在硬件质量验收、云化适配和故障检测修复等环节的效率,进而也提升了腾讯云大规模计算资源的调度效率。由此,腾讯会议能够实现单日高达五十万核计算资源的快速扩容。
这也是自去年发布以来,星星海SA2云服务器首次承担如此大规模的计算资源保障任务。虽然初出茅庐,但很显然星星海SA2云服务器完全应对了考验,并交出了令人满意的答卷。
事实上不仅仅是腾讯会议,包括大家熟悉的微信、QQ等核心业务,也包括视频转码、广告检索等多个模块中,星星海SA2云服务器都发挥了关键性的作用,也表现出了亮眼的性能。
基于微信业务的测试显示,采用星星海SA2云服务器能使其业务吞吐能力提升230%以上;在视频转码性能测试中,其性能也提升了200%;广告检索业务中使用星星海SA2云服务器也可明显降低检索延时。除了腾讯会议,在腾讯教育的远程课堂业务中,腾讯云也采用了星星海SA2云服务器,支撑了全国数千万师生的在线教学。
如果说当初走上自研服务器之路是腾讯基于业务进行业务决策,那么现在腾讯云采用星星海SA2云服务器进行服务则是将多年来腾讯在产品、技术上的积累特别是对互联网应用的理解释放出来,助力更多腾讯云的客户,让更多的人体验到云时代带来的便利与高效,加速客户业务发展和数字化转型。
后记:2018年,我参观了腾讯位于天津滨海的数据中心,这也是腾讯在北方区最大的数据中心,单数据中心服务器容量突破了十万台。其实作为与我们生活最密切的互联网厂商,腾讯软件、腾讯游戏我们每个人都在用,但是我们不知道的是在这个背后,腾讯云为了保障我们应用的流畅性、稳定性,也进行了无数的自研工作。
自研服务器只是腾讯云自研的冰山一角。从自研服务器到自研数据中心,再到自研云端软件,腾讯云已经在云计算技术自研领域进行了广泛布局。在数字化时代,IT技术特别是计算力已经成为了推动社会发展的源动力,而腾讯云所实现的,自然也是加速社会计算力的应用和普及,从而让每个人都感受到云计算时代的便捷与幸福。