申耀的科技观察 · 2022年09月13日 · 山东

PowerScale率先引入QLC:全闪存储系统普及,数字化转型提速

众所周知,NAND闪存的发展历经了从SLC、MLC到TCL、QLC的四个阶段。每个阶段的发展,都伴随着成本下降和容量及密度的上升,推动了闪存的进一步普及,但从性能和寿命角度,质疑也始终不绝于耳。

如今随着第二代QLC的上市,戴尔也正式引入了QLC SSD,这背后究竟有哪些“考量”?今天就来谈谈引入QLC的原因。

毫无疑问,数字化正在改变整个世界,而数字世界的底层支撑,在今天已演变成为数量庞大且不断产生、汇集、运算的非结构化数据。随着企业数字化转型的加速,数据已成为重要的新型生产要素,未来所有的场景都会以数据为驱动,而这些海量非结构化数据价值潜能的挖掘,则必须依赖强而有力的存储系统。

在此背景之下,全闪存储成为市场新的技术趋势。根据IDC数据显示,2021年中国全闪存储实现26%的增长,占据19%的市场份额。其中,近36%的全闪存储产品需求来自金融行业,同时制造、医疗、能源行业也在逐渐增加对全闪存储产品的购买。尤其是随着NVMe技术发展和SSD存储介质价格的下降,更多的行业将会使用全闪存储产品来构建或升级数据中心。

也正因此,戴尔科技集团日前宣布专为非结构化数据而生的PowerScale率先引入QLC SSD,希望能够更好地助力行业客户解决海量非结构化数据所面临的实时分析等挑战。此举不仅能够进一步降低企业部署全闪存储的整体TCO成本,让全闪存储的落地和普及变得更加容易,由此释放海量非结构化数据潜能,从而加速企业的数字化转型,背后的价值和意义无疑深远而重大。

引入QLC背后三重考量

事实上,作为数字经济中的新型生产要素,数据在过去几年时间里不但呈现出了爆发式的增长,其关键性更被提到了前所未有的位置。此前IDC也曾预测,到2025年产生的数据规模将达到180ZB,其中来自中国的数据有41ZB,而这一规模在2020年仅为全球64ZB、中国14ZB,而为了存储和处理这些随处产生的海量数据,存储介质的变革也就变得至关重要。

可以看到,目前SSD的存储密度和容量越来越大,同时NAND闪存也从之前的SLC、MLC逐渐转向TLC和QLC,其中QLC于2018年诞生,在三年前正式规模化商用以来,就受到了整个市场的高度关注。在戴尔科技集团大中华区存储产品经理岑广海看来,PowerScale在这个时间节点引入QLC,也主要是出于以下三个方面的考量:

一、从市场的发展看,NAND 闪存历经了SLC、MLC、TLC和QLC四个阶段,而QLC是继TLC后3D NAND的第四代存储方式,也是当前最新一代的闪存技术。从原理上来说,QLC的每个单元可储存4个数据(4bit/cell),也就意味着与前三种闪存相比,QLC闪存可以在同等的die面积上,存储更多的数据,也就拥有了更高密度、更大容量、更低成本的优势和特点。

因此,在企业级存储市场中,QLC SSD的规模化量产会带来更低的价格和更高的性价比。使其更适用于AI计算、机器学习、实时分析等应用,从而进一步拓展全闪在更多要求时效的应用场景的广泛使用。Gartner此前的预测中也认为,到2024年,产能升级中大约有超过1/4将会源自QLC SSD。

二、从应用需求看,目前包括金融、广电媒体娱乐以及EDA设计等行业,由于日常要处理大量人工智能、机器学习以及海量的非结构化数据实时分析等业务,因此他们需要部署全闪存储来化解这些挑战,这也导致QLC SSD受到了市场的青睐。

这些行业的一个重要特点就是性能要求高,同时存储容量也比较大,过去都是采用很多节点使用许多HDD硬盘并发吞吐来搭建系统,但随着全闪存储的发展,尤其业界一些知名的闪存盘供应商提供了不少企业级的QLC SSD的产品和方案,这样就让QLC SSD应用到新兴的工作负载中变为可能,同时更使得他们部署全闪存储节点时也有了更多的选择。”岑广海说。

三、从技术趋势看,无论是结构化数据,还是海量非结构化数据中,从混闪到全闪部署的转变也是新的技术趋势,而QLC SSD这样的闪存介质能帮助这种转变提速。

对此,岑广海表示:“在非结构化数据领域,QLC SSD的引入会让更多的行业用户在构建数据湖的过程中从目前采用混闪节点过渡到全闪节点,这将是未来的一个重要发展。”

背后的原因是,数据都是有不同的“热度”,对应的存储就可以采用分层的方式来实现金字塔式的数据生命周期管理。过去由于价格相对较高,很多用户只能针对少量的热数据采用全闪节点,而更多的温数据和冷数据通常都是采用不同类型的HDD硬盘。而未来有了QLC SSD之后,分层数据湖的理念会更加被市场接纳,更多的热数据、温数据可以用性价比很高的QLC SSD保存起来,从而更加有效地管理好企业的整个数据生命周期,并能更大程度、更高时效地挖掘这些数据潜藏的商业价值。

由此可见,快速增长的非结构化数据量超乎人们的想象,而要化解这种挑战,利用存储介质带来变化和优势,无疑是一个重要的方向,而QLC SSD无论是从市场前景、应用需求还是技术发展趋势来看,未来在全闪存储部署中扮演更加关键和重要的角色,也将是大势所趋。

PowerScale加持QLC

也正是洞察到这种变化,戴尔科技集团在其旗下的PowerScale中率先引入QLC SSD,其中PowerScale F600和F900这两款支持NVMe的节点提供了15TB和30TB两种QLC SSD的选择。

特别是30TB的QLC SSD将提供PowerScale产品组合中密度最高的闪存。单个PowerScale F900节点就可支持高达736TB的原始容量或者900TB的有效容量(每个节点都开启数据缩减的情况下),而整个存储集群容量更提高至高达186PB,这将是以前最大容量的两倍。由此可以更好地帮助行业客户化解海量非结构化数据带来的挑战,具体来看:

首先,在性能方面。我们知道,随着存储介质上每个单元存储的数据不断增多,尽管容量得到了提升,但市场上更多的关注点,还是其背后的性能和耐久性都会有所损失,但从TLC向QLC的切换过程中,PowerScale通过其存储系统整体性能的优化,使得使用QLC SSD的节点的性能和使用TLC SSD的节点维持在了同一个水平。

岑广海表示,性能对于行业客户而言确实是非常关键的,但是,考察存储的性能不能只局限于介质的性能表现,而应该从存储的整体表现来进行衡量。从戴尔内部的测试结果来看,PowerScale使用同样容量的QLC SSD的节点和使用TLC SSD的节点,其在性能方面的表现是一样的。之所以有这样的结果,是因为PowerScale在系统性能优化方面下了很多的“功夫”。

“PowerScale本身是一个横向扩展,且通过多个节点和高速网络连接组合而成的存储集群系统,因此在实现读写功能时,或者说当有一个文件进来之后,PowerScale会把文件进行切片,然后分散给到所有的节点,让节点自己去实现落盘——而背后代表的含义就是,数据不会只单独写到每一个节点之中,而是所有相关节点的多块存储介质分散地写,这样性能就得到了保障。

在此基础上,PowerScale还有一个NVDIMM系统,也就是说它提供非易失性内存的能力,因此当数据写入每个节点之中时,并不是直接落盘,而是先落在每个节点的NVDIMM里,等在NVDIMM中攒够了一批再落盘。这样无论是TLC或者QLC的SSD,对PowerScale而言几乎都是没有任何区别的,由此也最大化的利用了存储介质性能,并保证了对整个存储系统写操作的性能发挥。”岑广海说。

其次,在性价比方面。在性能和TLC SSD保持相同的情况下,QLC SSD最大的优势体现在,它每TB的价格会比现在降低20%。和传统的存储销售方式不一样,PowerScale是按照节点来销售的,因此存储介质成本的降低,就会带来同等容量规格的节点构成的存储集群成本的降低,或者同等容量的集群因采用更高密度的节点而带来成本的降低。这些都能整体上降低企业的TCO成本。

最后,在大容量全闪存储系统方面。高性价比的QLC SSD的引入也会推动大容量全闪存储系统的落地和普及。

可以简单计算一下,以PowerScale F600为例,其支持最低3个节点起步,那么当采用15TB的QLC SSD之后,整个存储系统最低支持的容量就是360TB的裸容量;而PowerScale F900,如果采用30TB的QLC SSD,最小配置也是3个节点,这个最小配置的存储系统支持的容量却可以高达2160TB的裸容量,相当于提供了2个PB的容量。而上面的这些最小配置,后续都可以根据业务需要,按需灵活地一个一个节点地增加,从而线性地扩展系统容量和性能。因此,无论是对于何种规模的企业,能够提供非常灵活的高密度大容量的全闪系统,同时也能够节约更多的空间和能耗。

更为关键的是,PowerScale由于是横向扩展系统,未来企业也可以在整个存储系统中,随着数据的增加不断扩充新的节点,或者加入其他更低成本的节点来保存冷数据。这样在同一个系统中就能实现分层数据湖的整个生命周期管理。这不仅是最科学的按数据价值来进行的存储投资,同时,也能大幅简化企业非结构化数据的管理,因为同一集群的分层数据可以根据规则在集群内自由智能流动,而无需人工干预。

释放非结构化数据潜能

当然,也要看到尽管QLC技术落地已经过去了几年时间,针对QLC技术的生态系统也在不断完善,但市场上对QLC技术依然有些“担忧”或者误解,主要集中在两个方面,即性能和寿命。

针对性能,上文已经有所涉及,对于基于QLC的SSD产品,目前SSD的供应商其实也正在通过多种技术对性能进行补偿,比如多通道,多die,利用高并发对性能进行补偿等;而PowerScale本身也在存储系统整体的性能优化方面进行创新,使得QLC的性能表现了取得了和TLC一样的成绩。

针对寿命,有 数 据 显 示:从 SLC-MLC-TLC-QLC, 其可擦写的次数 P/E(一次完整 NAND 全盘写入)从10万次、30000-1万次、300—1000 次、100—150次一路走低,也就是说其耐久度和寿命确实是显著了下降了。对此,岑广海强调说,如果从技术的角度出发来看,QLC介质的使用寿命完全不是一个值得担心的问题,因为可以从几个维度来做观察:

第一,衡量SSD的使用寿命涉及几个指标:PBW、P/E和DWPD。这三者的关系是DWPD = (PBW/CAPACITY/WARRENTY\_PERIOD/365)=([P/E]/WARRENTY\_PERIOD/365)。从DWPD指标维度看,所谓DWPD指的是每天的写入次数,目前戴尔科技集团使用的是企业级的QLC SSD,其DWPD的数据是0.42到1.7之间(取决于写操作的模式),那么对于一个企业而言,每天是否有可能对搭载了QLC介质的存储系统写入0.42次呢?

岑广海说:“我们以PowerScale F900最小配置3个节点来测算,如果都配置15TB的QLC SSD,大约能够提供1080TB的裸容量,也就是1个PB多一些,为了简单地示例,我们就拿裸容量来进行估算。在如此之高的容量之下,假设企业每天改动其中10%的数据,那就是100TB左右的数据,但在实际具体的应用中,很少有企业会每天都改动100TB的数据。可是我们用这1PB的容量乘以0.42的DWPD指标,却可以得到整个存储系统每天允许420TB的数据量被改动,这远大于刚刚计算得到的100TB的改动量。”

“所以即使企业真的每天要写入100TB的数据,那么QLC SSD也是能够完全支持的。同时读操作对QLC的使用寿命是完全没有影响的。而实际上,企业大部分应用并不是只有纯粹的写操作,而是混合的读写操作,甚至,大部分的应用属于读多写少。因此,我们不能仅仅只看到QLC 0.42的DWPD指标,就简单地下结论说QLC使用寿命短不适用于企业存储,而要具体分析企业实际使用场景,从而来打消客户在网络上阅读到的QLC使用寿命不行的简单印象。”他强调。

确实如此,如果我们继续分析的话,不仅是企业很少每天改动超过100TB的数据量,同时对企业来说因为数据本身也会做数据分层,有热数据,也有温数据和冷数据,那么在热数据当中它的热度会保持多长时间呢,是一天,一周还是一年等等,那么当这些数据从热数据变成冷数据之后,还会继续每天去做读写操作吗?因此,对于QLC SSD盘来说,目前实际上是没有足够的数据,将全盘写满100次,且写满100次也需要很长的时间,可以说QLC SSD盘被“写穿”的现象其实仅存在理论的层面,在具体的企业应用中是难以发生的。

上面的计算是基于QLC SSD保存了所有热度的数据进行的分析。如果有客户强调说,采用QLC的节点保存的都是热数据,而温、冷的数据会迁移到其他采用HDD的节点,这样就会使得QLC节点的写寿命变得非常聚焦而突出。针对这个问题,我们可以这样来思考:最低配置的QLC节点池是F600配置15TB的QLC SSD,那么最少也是拥有360TB裸容量的空间。即使按0.42的DWPD(100%写操作)来计算,那么又有多少客户拥有持续每天写入远超150TB的数据的需求呢?

第二,从QLC介质维度来看,针对 QLC NAND 颗粒的寿命和耐久度,这次PowerScale采用的是第二代企业级的QLC SSD,来自Solidigm(也就是原来的英特尔的全闪驱动器)。Solidigm所使用的垂直浮栅闪存采用了更高端的氧化层进行控制,大大降低了电子干扰的风险,同时将电子数量提升了6倍左右等等,再如Solidigm在QLC SSD盘固件设计上,也有磨损均衡设计,尽可能将数据均匀散步在各个颗粒,避免局部热点的出现等等,换句话说QLC SSD供应商方面,本身也在一直提高QLC介质的寿命。

第三,从PowerScale的维度看,PowerScale同样针对QLC SSD提供了三重的“保障”,包括PowerScale的体系架构设计和读写机制上,能够有效的延长SSD盘的使用寿命,具体的原理在上文中已经分析过;同时,PowerScale针对QLC SSD也提供了对应的维保服务,一旦QLC SSD出现问题,在有效维保期内,同样能够免费更换的。

岑广海最后表示:“我们之所以如此强调QLC的寿命问题,主要是很多客户对QLC的寿命问题有很多的疑虑,但其实QLC使用寿命的问题是不用担心的,因为无论是介质的供应商,还是戴尔科技集团已经在多个方面提供保障,希望能够进一步打消客户的担忧。目前,从戴尔全球客户的应用情况来看,不少行业客户已经成为了首批‘吃螃蟹’的客户,而在中国市场,我们也致力于通过PowerScale提供QLC SSD选择,推动大容量高密度的全闪存储系统的进一步落地和普及,帮助更多行业客户更好的应对非结构化数据的挑战。”

总的来说,全闪存储系统过去几年之所以保持了高速的发展,关键就是大量新技术的引入,如基于NVMe的全闪存阵列能够进一步减少存储时延;而QLC SSD的引入,则是能够显著提高存储容量的同时,更有助于企业进一步降低TCO成本。

从这个角度来看,本次PowerScale率先引入QLC SSD,其实在整个存储市场中也起到了“风向标”的价值和“示范效应”,不仅能够推动非结构化数据的全闪存储的落地和普及提速,也能够帮助企业实现数字化转型的加速,并最大化的释放海量非结构化数据的潜能。

推荐阅读
关注数
2396
内容数
432
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息