申耀的科技观察 · 2023年04月05日 · 山东

PowerScale OneFS:让数据“活起来、动起来、用起来”

毫无疑问,随着云计算、大数据、人工智能、物联网等新技术在各行业广泛的普及,在催生了海量数据的同时,也让数据的管理和价值的挖掘变得愈加困难。

也正因此,国家近期正式发布《关于构建数据基础制度更好发挥数据要素作用的意见》。“数据二十条”的出台,为加快构建数据基础制度,充分发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能,做强、做优、做大数字经济,增强经济发展新动能,让高质量数据要素真正“活起来、动起来、用起来”。

在此过程中,想要充分发挥数据要素的价值,离不开健壮的存储软硬件基础设施的支撑。在此背景下,戴尔科技集团日前宣布专为非结构化数据而生的PowerScale,推出了全新的OneFS 9.5版本。

此次操作系统升级在性能、安全性和智能化三个方面做了全面的迭代,为企业客户加速获取数据价值一路保驾护航。更为关键的是,作为戴尔科技集团在软硬件融合创新领域的“集大成者”, PowerScale历经多年的发展,也以其独特的价值优势,帮助企业客户快速构建以文件为核心的分层数据湖,进一步助力更多中国企业释放数据价值,加速业务创新发展。

非结构化数据全新挑战

根据艾瑞咨询2022年发布的《中国数智融合发展洞察》数据显示:据测算,全球数据量以59%以上的年增长率快速攀升。对比全球,中国数据量的上升则更为迅速。预计到2025年,中国数据量会达到49ZB,到2030年,将会达到空前的175ZB,这样的数据规模增量着实惊人。

与此同时,伴随着数据量的飞速增长,不同种类数据比例结构也在发生变化,其中非结构化数据的占比在不断上升,当前数据总量中80%已经是非结构化和半结构化数据。

戴尔科技集团大中华区存储产品经理岑广海认为,随着非结构化数据在企业数据中的占比越来越高,其对企业的重要性不言而喻,因此非结构数据的安全性、性能乃至运维管理方面遭遇的挑战也就越来越多。

第一,从安全角度看,由恶意软件和勒索攻击带来的网络安全威胁,如今同样成为了非结构化数据保护必须重视的问题。非结构化数据量十分庞大,例如企业的核心数据库一般也就是几十到几百TB级别,但非结构化数据通常都是以PB为单位。

如果对此类海量的非结构化数据进行良好的数据保护,所需的技术、成本和时间都与结构化数据不是一个量级的,因此带来的数据管理和数据保护挑战存在显著差别。

第二,从性能维度看,当前包括金融、广电媒体娱乐以及EDA设计等行业,由于日常要处理大量人工智能、机器学习以及海量的非结构化数据实时分析等业务,因此这些行业对存储基础设施的性能也提出了更高的要求,这也推动了整个存储行业从混闪到全闪部署的转变,甚至部分行业客户也已经开始全面部署全闪存储节点。

第三,从运维角度看,一方面,随着数据智能管理、大数据分析、物联网等全新的应用和工作负载的出现,这要求不同的工作负载需要不同的存储平台去做支撑,而通过智能化技术的识别和判断,则可以加速和优化这个过程。

另一方面,则存在于日常的存储运维工作中,重复工作自动化、复杂工作智能化、运维管理现代化也是用户相当关心的话题,因此通过智能化解决非结构化数据中的这些“痛点”也成为了新的技术趋势。

也正是洞察到这种全新的变化,作为业界公认最好的横向扩展NAS平台操作系统OneFS,也始终站在客户需求的视角,通过不断的创新和迭代,快速满足客户的需求。

事实上,从2020年6月OneFS更新到9.0版本以来,在过去短短的三年的时间里,OneFS就经历了6次快速的迭代,并在今年1月正式推出了OneFS 9.5版本。

此次操作系统升级带来一系列安全特性和功能,企业客户无需硬件升级,即可获得显著的性能提升以及安全升级,真正满足了企业客户对数据以及新一代存储基础设施的最新需求。

三大维度解读OneFS 9.5

接下来,我们就详细解读一下OneFS 9.5版本的三大关键特性。

首先,在安全特性方面,OneFS 9.5版本全面支持零信任架构,并支持多因子身份验证(MFA)、单点登录(SSO)支持、TLS 1.2、USGv6R1 IPv6支持以及新的基于主机的防火墙,这些都是OneFS 9.5安全特性更新的重要内容。

以多因子身份验证为例,OneFS 9.5允许用户使用包含其登录凭证的CAC或PIV智能卡来获得对集群的访问,而不是手动输入用户名和密码信息。

此外,OneFS 9.5会自动禁用不活动账户,提供并发管理会话限制,并延长登录失败后下一次登录的时间等等。再如,内嵌的防火墙满足STIG和APL要求,允许安全管理员根据相关安全策略通过集群的命令行或WebUI进行端口封锁和数据包过滤等。

其次,在性能提升方面,OneFS 9.5版本也带来了巨大的性能提升,特别是SmartCache的增强使得OneFS 9.5在F系列的全闪存NVMe节点——F600和F900上可以获得多达55%的流式读取性能,可为媒体和娱乐工作负载以及AI、机器学习、深度学习等应用场景提供更为强大的性能支持。

对此,岑广海表示:“ OneFS 9.5在代码方面针对NVMe此类协议进行了大量的优化和改写,因此让F600和F900能够在大文件的读写方面取得较为明显的性能提升,有助于新一代工作负载能够在企业的应用场景中更快的跑起来。”

与此同时,在OneFS 9.5中,“SmartPools”也引入了可配置的传输限制,这些限制包括以百分比表示的最大容量阈值。若超过该阈值,SmartPools将不会尝试将文件移动到特定层,从而提高可靠性和分层性能。

而“SmartQoS”拥有精细的集群性能控制功能,允许管理员配置针对NFS、S3、SMB多种协议,或混合协议工作负载中的能够使用的最大协议操作数,因此可以提升更多的可预测的共享访问体验。

“相比业内的同类产品,OneFS 9.5中的SmartQoS颗粒度会更加的精细,也就是说我们可以支持用户名、区域、本地或者远端的IP地址,乃至IP地址的范围来进行控制,这样就让企业在管理上变得非常简单且灵活,在提高整体集群性能的同时,也能更好地控制可用资源。”岑广海说。

最后,在智能运维方面,OneFS 9.5版本也支持SupportAssist,这是戴尔科技集团推出的下一代远程连接系统,全面替代了ESRS,可用于将事件、日志和遥测数据从PowerScale集群发送至戴尔支持部门,这样戴尔支持部门就能够第一时间快速对PowerScale集群问题进行远程诊断和修复。

SupportAssist带来的优势主要体现在两个维度,能够使用访问密钥或PIN码和硬件密钥,从而为PowerScale集群提供更好的安全性;同时,SupportAssist也能和CloudIQ 无缝结合,帮助企业更好地进行集群的健康分析等。

从OneFS 9.5版本提供的三大特性中可以看到,它不仅满足了当下企业客户对于存储基础设施的全新需求,同时也从侧面印证了:正是由于OneFS操作系统始终保持着“与时俱进”的升级迭代,才让PowerScale在非结构化存储领域保持了极为强大的竞争力,而这也正是PowerScale在市场中“一直在引领,从未被超越”的关键所在。

*PowerScale由英特尔®至强®处理器提供支持,该处理器采用软件定义的基础设施和敏捷云架构,为PowerScale提供了卓越的性能和效率,可加速要求严苛的文件工作负载,使企业发挥数据资本的价值,加速业务的数字转型。

为构建分层数据湖筑基

值得一提的是,数据湖作为一种新的数据存储理念在业界逐渐兴起,其原因在于数据湖具有“兼容并包”的特性,如数据湖结合数据科学与机器学习技术,能帮助企业构建更多优化后的运营模型等。

此外,通过对数据湖分层,也能帮助企业实现“金字塔式”的数据生命周期管理,在降低成本的同时,也能更大程度、更高时效地挖掘这些数据潜藏的商业价值。

在这方面,PowerScale+OneFS,通过几年来在软硬件融合领域全面创新所形成的独特价值优势,如今也能快速和轻松的帮助企业构筑以文件为核心的分层数据湖,帮助用户在核心、边缘和云端各种环境满足不同业务应用的复杂数据需求。真正打破数据壁垒,并在瞬息万变的市场中保持领先。

「共享」一数多用

指的是基于PowerScale构建的分层数据湖,其文件可以被多个系统使用,无论是不同的操作系统,还是不同的应用都可以统一的访问到所需的文件或者数据。

换句话说,PowerScale能够保证企业从系统中获取的数据具有一致性,且都是准确和及时的。不仅如此,PowerScale所具备的共享能力,也能帮助企业客户更快的打通文件共享的流程,并确保文件或数据的完整性。

「扩展」自由伸缩

PowerScale借助OneFS强大的横向扩展体系结构能力,可以让企业根据需要,动态配置所需的恰当的容量和性能。

PowerScale可提供从最小11TB到近100PB规模的单文件系统的存储能力,支持对数百万个文件进行操作,彻底消除数据孤岛;同时,智能的横向扩展集群也可确保在添加节点时不会出现“热点”,带来存储效率的提高,这也意味着基于PowerScale构建的分层数据湖“可大可小”、“伸缩自如”。

「管维」跨代混搭

跨代混搭是实现分层数据湖最大的技术要点,而PowerScale不仅支持新老节点,同时也支持全闪、混闪不同的节点完全“融洽”地结合到同一个存储集群中,由此给存储设备的生命周期管理带来极大的好处。

岑广海举例说:“ PowerScale的独特之处就在于,即使是同样的全闪节点,PowerScale跨代混搭的能力可以支持新一代和老一代的全闪节点结合在一起,数据依然可以在同一个集群中被访问。这就使得每一个全闪节点都做到物尽其用,也简化了设备生命周期管理,新一代节点可以简单加入集群,立刻投入使用,过旧的节点也可以一条命令就撤下集群,而由此需要的数据迁移则完全在背后自动化智能进行。另外PowerScale跨代混搭还在于支持全闪节点和混闪节点的结合,让冷热数据更好地分层,进而为企业后续实现数据生命周期管理带来了极大的管理和运维的方便性。”

「安保」文件防护

针对非结构化数据的保护,PowerScale也构建出了“立体防御”的能力,即PowerScale基于Superna Eyeglass Ransomware Defender“加持”,可以为企业提供多重数据安全保护能力。

这包括本身所搭载的OneFS操作系统具备的安全特性,能够为企业提供定期的只读型快照、通过SmartConnect、Access Zones和RBAC实现逻辑隔离能力以及支持加密功能复制和快照的容灾能力等。同时,在主动威胁保护方面,PowerScale可提供实时勒索软件保护、反病毒扫描、SmartLock支持第三方的安全凭据提供等。

不仅如此, PowerScale也提供支持硬件加密的AirGap能力,企业可以借助AirGap将关键数据复制到第三组隔离网络,同时支持硬件方式实现数据加密,这样企业就可以用于数据隔离、自动威胁检测和快速恢复,最终确保企业的分层数据湖安全“无忧”。

「效率」有效容量

指的是PowerScale基于第五代存储构建,拥有业界领先的重删、压缩等数据缩减技术,不仅能够为企业提供性能无损的有效容量,同时也能高效地帮助企业实现存储资源的利用,降低分层数据湖构建的TCO成本,实现可持续的发展。

岑广海补充表示:“ 戴尔科技为PowerScale提供1.6:1的数据缩减能力的保障,这也意味着企业1.6PB容量的数据,仅仅只需要购买1PB的容量即可,因此PowerScale不仅能提高企业的存储效率,也具有极高的经济性。”

「价值」数据管理

随着数据爆炸式的增长,数据的生命周期管理也被企业提升了日常,而基于PowerScale构建的分层数据湖同样在数据管理方面能够给企业带来更大的价值。

具体包括PowerScale支持跨代混搭,企业可将热数据放在全闪节点中,温数据和冷数据可以放在混闪节点中,让全闪节点去“跑”新一代的工作负载,而用最经济方式去保存温数据或者冷数据,由此实现更加合理的数据生命周期管理。

除此以外,在数据的生命周期管理方面,管理的颗粒度(文件、路径)、管理的灵活性(在线动态调整,实时生效)等都需要考量,而PowerScale对此都有令客户非常满意的解决方案。

更为关键的是,PowerScale也能够更好的支持数据虚拟化。所谓数据虚拟化指的是今天的数据可能存储在任意环境之中,而PowerScale支持多协议访问能力,既解决了不同用户的不同访问方式的需求,同时也解决了数据在存储和使用中的一致性和完整性问题,帮助企业站在一个更高的视角来管理和使用数据,最大化发挥数据的价值。

正如岑广海所言:“ 过去几年戴尔科技集团一直在分层数据湖领域耕耘,始终站在企业用户和运维人员的体验上,不断地升级和完善这个方案,最终让基于PowerScale构建的分层数据湖方案,成为企业通往数据湖道路上的一个更好选择,既无需为数据的存、管、用绞尽脑汁,也能够快速通过分层数据湖实现业务的创新。”

在全行业乃至全社会希望高质量数据要素真正“活起来、动起来、用起来”的今天,PowerScale及其存储操作系统OneFS通过软硬件融合的全面创新,以及业界独一无二的分层数据湖方案,不仅帮助中国企业用户实现了更好的数据管理和应用,也为发挥数据要素的更高价值注入更多的驱动力,提供更大的想象力。

推荐阅读
关注数
2395
内容数
426
专注产业互联网、企业数字化、渠道生态以及汽车科技的 观察和思考。
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息