数据,数字经济时代第五大生产要素,正在受到全世界所有政府、组织和个人关注。大数据与人工智能技术不断将每比特数据中的更多价值挖掘而出,使数据安全保存几乎等价于财富的有效留存,而数据利用效率约等于价值创造速度。因此,数据存储的重要性也上升到前所未有的高度。
若论近10年来数据存储界最大的技术革命,闪存硬盘(下简称SSD)替代机械硬盘(下简称HDD)绝对当之无愧。据Gartner统计,从2022年起,全球SSD发货量已经超过HDD;随着存量硬盘持续过保,预计2026年全球存量硬盘中SSD占比将达到32%。如今在笔电市场已很难见到HDD;在台式机及企业市场,HDD也几乎丢掉所有热数据存储格局,不得不转向温冷数据存储市场。
尽管HDD厂商仍在努力推出新技术,以不断提升HDD单盘容量和降低成本,但存储业界对HDD的未来判断依旧悲观。著名存储厂商Pure Storage认为,2028年后市面上HDD将全面停售;分析师机构Wikibon则认为,2026年SSD每TB单价将低于HDD——这无疑是给HDD判了死刑。笔者对HDD同样持悲观态度,本文希望从更多视角出发,全面论述为何HDD时代已进入倒计时。
如果我们从时间和类型两个维度来看待数据的变化,会很容易发现越来越多的数据能够被人们有效利用并发挥价值,人类也越来越依赖数据。
历史数据的价值正在变得越来越大。过去由于数据保存与检索的艰难,人们很难从历史信息出发去分析事情。但搜索引擎和大容量存储技术的普及,使得历史数据被完整保存下来,并轻易地被人们获取。现在每个人都可以通过谷歌查询到一个关键词最早在什么时期出现在互联网中,每一个相关网页的快照都被记录下来以便了解事情的变化趋势。历史数据在医学领域应用更为广泛,医生可以通过患者的历史病历推断出病灶,健康监测设备可以通过比对历史数据来分析被监测者身体状况。历史数据彰显的价值越大,人们就越倾向于保存与使用它们,这使得历史数据规模变得更大、热度更高。
随着数据分析技术的发展,几乎所有类型的数据都变得极具价值。过去,人们只能从结构化的数据中得出结论,而文字、图片、视频等非结构化数据难以分析,无法获取统计学价值。如今,自然语言处理(NLP)、计算机视觉(CV)等机器学习算法可以从人类无法察觉的深层维度获取到非结构化数据背后的隐藏信息,进而提取出非常有价值的规律,比如洞察生产物件的瑕疵、理解文字背后的潜在含义等。与结构化数据不同,非结构化数据非常容易采集,且最接近事物原貌,往往蕴含着更多的深层信息——在数据分析技术的帮助下,非结构化数据将越来越多的作用于生产决策,也因此会变的规模更大、访问频次更高。
不管你接受还是抗拒,以人工智能技术为核心的第四次工业革命已经来临,拥有更多数据且更会利用数据的组织将成为此次工业革命的大赢家。与此前不同的是,数据作为第四次工业革命核心资源,并不为少数人拥有,而是牢牢掌握在每一个人和组织手中,区别将产生于数据拥有的规模和使用的效率。而随着数据持续变大、变热,HDD将越来越不被需要。从访问速度来看,即使是商用SSD家族最慢的QLC SSD,性能仍比HDD高20倍左右;从容量来看,当前市面上最大单盘容量的HDD大概在22TB~26TB之间,而SSD则早已突破100TB、正向200TB迈进。当企业和个人保存了越来越多的历史数据,并持续通过人工智能技术挖掘历史数据价值、指导当下决策时,他们一定会希望这些历史数据能在需要时被快速调出,并在有限的空间内容纳几乎无限增长的数据。此时,他们会如何在SSD和HDD之间做抉择呢?
如今,HDD唯一能够战胜SSD的指标可能仅有低廉的价格了,但这一成本优势也在逐步走弱。据Wells Fargo统计,SSD与HDD价格差距在2013年~2020年间从40倍快速缩小至10倍左右;Wikibon的统计数据则指出2013~2020年间SSD价格年平均增长率为-33.5%,而HDD仅有-13.5%,这说明SSD和HDD的价格正加速迫近。根据预测,在2021~2030年,SSD将继续以-26.1%的速度持续降价,而HDD的CAGR将降至- 5.4%。价格拐点将在2026年出现,届时HDD将彻底丧失价格优势。
从技术发展角度来看,这一趋势成为现实的可能性很大。HDD主要依靠磁头运动改变盘片上磁道的极性来记录数据,这一特点决定其创新空间正变得越来越窄。从最早的LMR(水平磁记录)技术,到2006年PMR(垂直磁记录)技术出现,到2015年推出SMR(叠瓦式磁记录)技术,再到预计2025年HAMR(热辅助磁记录)盘问世,平均每9-10年才有一次突破性技术换代,每次创新都只能在有限盘片空间上,“榨取”出“微乎其微”的新数据空间,以致于SMR技术至今仍因为信息记录过于密集、写入数据时易影响周边数据而广受诟病。最新推出的HAMR技术,使用热稳定性极强的材料打造盘片,并采用激光在一纳秒对磁盘上的颗粒疾速加热和翻转其磁极性,进而实现在磁道极密的情况下不影响其他磁道颗粒的机型,这种需要极高创造力和工艺才能实现的技术,恰恰证明了HDD的创新缺乏可持续性的危机。此外,HDD行业经过多年大浪淘沙,目前只剩下少数几个玩家,形成了极深的技术壁垒,封闭的生态已成为技术创新巨大阻碍。
SSD恰恰相反,虽然起步较为缓慢,在上世纪80年代才推出SLC NAND Flash,但此后MLC(1997)→ 3D MLC(2007)→TLC(2009)→ 3D TLC(2012)→ QLC(2015)→ 3D QLC(2018)→ PLC(2022),平均3年就有一次重大技术突破。SSD的创新空间非常宽广,创新逻辑也具有较强的持续性,除了不断增加单位颗粒可记录的数据量(从1bit到最新的5bit),还可以垂直增加堆叠层数(TLC已经突破300层)、横向增加颗粒贴片密度,只要芯片制程继续演进,SSD就有可持续的创新空间。SSD产业的玩家也非常多,从颗粒、盘控芯片到整盘制造都有大量玩家,技术生态呈开放状态,对于快速迭代创新具有良性推动作用。
综合产业发展情况,HDD成本优势正逐步丧失,创新的步伐也日趋缓慢。相比于如日中天、发展不断加快的SSD,HDD已越来越难满足用户需求。
跳出硬盘领域,从IT乃至工业产业的发展趋势来看,会发现从第二次工业革命以来,各行各业创新的主线都是以电子技术逐步替代机械中的部分物理器械,并逐步演化出一门新的学科——机电工程。
汽车行业的变革就是一个典型例子。早在19世纪30年代,电动汽车雏形就已问世,但由于续航及生产成本问题没有竞争过燃油汽车,进入了近1个世纪的沉寂期。进入21世纪,电池、电机和控制系统等技术的同时进步,电动汽车再次掀起汽车革命。内燃机通过气体爆燃驱动活塞发动机做工,再通过物理传动装置驱动轮毂转动,大量能量在冷却、排气、泵气和机械传动中损失掉,转化率只有30%~40%;而电机通过改变电流方向形成旋转磁场,直接驱动轮毂转动,省去了许多传动装置和变速装置,能量转化率可达到90%以上。因而人们发现电动汽车拥有更高的能量效率、更快的加速和更简单的结构——尽管续航存在限制,电动汽车仍广泛流行起来。
现代自动化工业也同样如此。笔者曾有幸参观过某著名屏幕制造商工厂,硕大的厂房内没有一个工人或工程师,所有的制造都通过自动化机械夜以继日的完成。支配他们工作的是数字化产线控制中心,指令通过电路或者无线波极速传递,所有制造器械由电机精确控制动作,品控通过AI质检技术把控。不论是效率、成本还是准确率,基于电气技术打造的自动化工厂都比人工工厂强出许多。
此类电子技术替代物理技术的故事在其它行业也屡见不鲜。归根结底,电磁波以宇宙中最快的速度——光速传播,只要驱动方式合理、传输损耗足够低,其效率就一定比物理传动的方式高出许多。回头看向硬盘领域。HDD通过电机驱动磁头物理运动读写数据的方式,相比于SSD通过电流传输颗粒电平高度进而读写数据的方式,显然不在同一产业发展阶段。尽管HDD的设计堪称人类工程学史上的奇迹之一,尽管HDD推出了各种令人拍案叫绝的创新技术,这依旧无法改变其依赖物理技术的本质,必将快速沉入历史的尘埃中;而SSD,尽管其颗粒寿命限制仍有诟病,尽管其成本尚未足够亲民,但通过电子运动存取数据的方式,已决定其成为这场数字化革命的最终赢家。