2017年,VMware发布了VMware Cloud on AWS,吹响了私有的基础架构云厂商进驻公有云,并为公有云用户提供基础架构服务的号角。这是一个标志性的事件,一方面,表明公有云基础架构服务的灵活性、重要性不但被越来越多中小型用户认可,同时,也得到了以VMware为代表的私有云行业龙头企业的认可和关注;另一方面,反应出公有云提供的基础架构服务在某些场景下,需要其它基础架构供应商进行补充,从而满足差异化的市场需求。
在虚拟化、混合云的计算领域,有类似VMware这样的厂商,为用户提供运行在AWS环境中的VMware软件服务,同样地,在数据访问和管理方面也是如此。近些年,出现了众多存储软件厂商,将他们的软件部署到公有云上,为公有云的用户提供基础架构层面的数据存储和管理服务,为公有云原生的存储服务进行了有益补充。在Gartner 2019年发布的混合基础架构服务能力成熟度曲线上,首次出现了混合云存储技术。Gartner认为,以新技术、新场景驱动的混合云存储等相关技术,在未来数年会为企业带来下一波巨大的商业价值和转型优势。
混合云存储技术,经历了若干年的发展。起初,混合云存储只是为公有云提供的存储加上某些访问网关,以作为数据备份的用途,用于存放某些价值密度低的归档型数据。这些年来,人工智能、大数据、物联网等新型应用蓬勃发展,新型应用最重要的作用,就是要从大量的数据和信息中提取商业价值,这些新型应用对计算能力具有强烈要求,而本地自建计算资源弹性差、周期长、成本高,两者产生了巨大矛盾,公有云成为了解决这一矛盾的有效手段。这些新型应用在公有云上,将不再只局限于归档这类低价值的数据,转而需要大量具有核心价值的数据,才能帮助企业充分利用公有云上的计算优势。因此,混合云存储成为了企业通过公有云,撬动和挖掘更大商业价值的支点和杠杆。
Gartner预测,与2020年相比,到2024年,大型企业存储在本地、边缘或公有云中的文件或对象存储的非结构化数据将增加两倍,实施混合云存储架构的企业将从2020年的10%,增长到2024年的40%。
混合云存储,并没有改变存储技术服务于信息保存、访问、为应用提供业务价值的核心本质,也没有创造出新的应用访问接口(应用访问还是块存储、文件存储、对象存储的接口类型),其技术的核心,在于适应云计算发展和应用迁移的趋势,提供更方便于应用访问、经济效益更高的存储服务交付模式、以及数据流动的方式。
混合云文件系统市场分析
从混合云存储提供的数据访问接口上看,例如Qumulo、NetApp、Nasuni等厂商都将关注点集中到文件访问接口,为什么各大厂商会对混合云的文件接口如此感兴趣呢?我们认为有以下几个原因:
与公有云原生存储形成有效互补
块存储是公有云的核心基石,公有云的主要业务来源于虚拟机、云磁盘,这类业务都必须提供块存储支持,业务诉求清晰、统一,即可靠、低延时、高IOPS,对公有云厂商而言,容易形成标准且统一的产品,因此,当前除了一些主存储、超融合或私有云厂商在公有云上提供托管且与私有云用户体验相同的面向块存储的产品和方案外(例如Nutanix Xi Leap、VMware Cloud on AWS),很少第三方厂商将精力投入到在公有云上提供块存储产品。
对象存储也是公有云最早成熟的产品,例如AWS的S3,几乎就定义了整个业界对象存储的标准,由于缺乏实际的客户价值和差异点,也极少有存储技术厂商基于公有云提供对象存储服务。
反观文件存储,业务类型非常广泛,有归档类的、在线类的。各种业务类型IO特征复杂,例如日志写多读少、追加写多;AI对小文件顺序读、大文件随机读、高带宽、低延时的要求高;渲染类应用具有高带宽、低延时、读写混合的IO特点;HPC多客户端并发读同一个文件;归档应用写多读少、要求低成本。公有云厂商本身很难通过一个统一文件系统产品满足所有应用的需要,因此公有云厂商通常的做法是,针对通用的场景和诉求,满足标准的文件访问协议,提供NFS、SMB等通用的文件服务,而特定类型的场景及IO诉求,则为众多创新型存储厂商提供了用武之地,存储厂商可以基于这些场景与公有云形成很好的结合和互补。
上层应用决定IT基础架构
大量基于文件接口访问数据的应用程序,是混合云文件存储生存的实际土壤。AI、HPC、大数据、渲染、PACS医疗影像、资源勘探、基因分析、物联网等应用,对非结构化数据通过文件接口进行存储和访问是强需求,将文件接口转换成对象访问接口,需要重写应用程序,带来额外的开发工作量,文件接口和对象接口在读写特点上也存在不同,例如对象存储对随机写缺少支持。因此,大量的厂商致力于在计算所需要的地方,为应用提供满足应用特点的个性化文件存储产品和方案。
从基于公有云的第三方文件系统实现方式看,有以下几个代表厂商和产品:
ScaleUp架构的文件存储系统
NetApp基于庞大的私有环境企业级用户群体,推出了可以在AWS等公有云上软件化部署的产品,通过公有云上的软件化方案,可实现与企业内部NetApp文件系统无缝数据迁移、备份和访问功能,除了个别基于硬件的功能差别外,公有云的NetApp软件与NetApp设备所提供的用户体验大体相同。NetApp的公有云软件服务还是基于ScaleUp的思路,在数据规模上存在一定局限性。
底层基于对象存储的文件访问网关
Nasuni的UniFS是基于公有云底层的对象存储,加上可配置的企业内部Nasuni文件缓存设备(或虚拟设备),提供大容量的文件存储产品。这种产品可以满足企业日常共享使用文件,尤其是分支机构较多的企业访问统一文件系统的需要。由于底层使用对象存储的性能和延时难以预期,企业内部经常访问的数据,需要通过内部缓存来实现,缓存数据的规模以及企业与公有云带宽的限制,会一定程度上影响用户实时读写数据的体验,适用于日常办公或数据备份等场景。
ScaleOut架构的分布式文件存储
Qumulo在公有云上提供可扩展的分布式文件系统,公有云上运行的Qumulo文件系统可实现与企业内部Qumulo文件系统的同步,提供快照等功能,从这个角度上看,弥补了公有云从功能到混合云场景中的一些功能欠缺,也是近年来发展较快的新兴文件存储厂商。
YRCloudFile引领国内混合云存储浪潮
继国内首个进入CNCF Landscape的容器存储产品之后,焱融科技再次捕捉到混合云存储的技术领先趋势,于2019年6月就推出了基于公有云的YRCloudFile软件版本,定位在支持混合云业务非结构化数据的存储和访问。
YRCloudFile的混合云存储方案具有以下特点:
支持国内外各大公有云平台、本地数据中心,及边缘部署,可基于企业内部通用服务器,公有云的云主机、云盘进行部署,在AWS、腾讯云、阿里云上提供一键化快速部署能力,可在数分钟内为用户提供文件存储服务。
以阿里云为例,只需在阿里云ROS模板中简单输入VPCID、VSwitchID、密码、授权秘钥等几个配置,即可通过ROS模板一键部署YRCloudFile平台。
可结合底层对象存储提供数据冷热分层功能,降低用户使用成本。在某IoT客户实际应用场景中,用户每天生成约2TB数据,一部分数据需要在一定周期内保存在热数据层中,随后数据趋冷,可通过YRCloudFile自动下刷至对象存储。YRCloudFile通过4台云主机,只需使用约30TB云盘,即可满足用户热数据访问需求,结合YRCloudFile分层及压缩功能,第一年可为用户节约近10万元成本,次年可节省约55万元,第三年节省134万元,三年累计可节省约200万元成本。
高性能特性可满足AI、视频渲染、HPC等应用需求,元数据集群和数据集群可随时按需扩展,单集群可支持数百亿文件的存储。在AWS上,YRCloudFile在8节点和16节点EC2云主机中,使用不同文件大小,访问性能可达到线性扩展,16节点提供高达15GB/s带宽性能。
容器持久化存储支持。公有云上应用的容器化进程高于企业内部, YRCloudFile能够为运行在公有云上的Kubernetes提供CSI和FlexVolume接口,支持RWX、RWO等读写模式,满足各种应用对持久化存储的访问需求,并提供PVC配额、QoS、Resize、PV热点监控等功能,更好地服务用户在公有云上运行的容器持久化应用。
数据跨云同步。YRCloudFile可部署在私有云、公有云、边缘节点上,不同节点中的数据可通过YRCloudFile自带的同步功能实现自动同步,可以最大程度发挥云上及边缘的计算能力。在渲染场景中,艺术家,只需要将素材上传至工作室的文件系统集群中,YRCloudFile即可将数据自动同步至公有云的YRCloudFile集群,为渲染所需的数百台高性能计算服务器提供高性能数据访问,渲染结束后,渲染结果可自动同步回工作室存储集群,极大提升整体工作效率。
总结
伴随着近年来公有云的快速发展,大量企业逐步开始接受将IT投入,由传统的CAPEX资本型一次性支出,转化为更精细化的OPEX运营型支出,使公有云成为越来越多企业的选择。然而,公有云计算资源的优势,在缺乏新一代混合云文件系统支撑时,无法得到全面释放,焱融科技帮助客户轻松应对混合云新架构下的数据挑战,充分发挥数据价值,提升企业效率。