大数据存储技术是大数据领域的另一个关键数据,人们利用分布式存储代替集中式存储,用更廉价的机器代替之前昂贵的机器,让海量存储的成本大大降低。在边缘计算领域,由于边缘集群数量众多,集群规模较小,在这种趋势下,如何降低边缘储存集群的功耗和保持一定性能成为当前分别是储存的重要方向,也是符合国家“双碳”大战略的必然需要。
在“东数西算”的大背景下,双碳需求成为当前IT行业最大需求。今天我们结合云原生技术和PCIe Net技术介绍一种构建低功耗、低成本对象储存的方法。同时说明如何利用PCIe Net达到高达30%以上碳排量节能方案。
一、云原生对象储存选型:minIO
minIO是按照云原生架构设计的对象储存,具备非常强大的性能和易用性,在大数据、私有云、公有云中存在大量应用。
关于minio的部署和介绍,参看:
- 高性能对象存储MinIO介绍 - 知乎 (zhihu.com)
- Minio第一课:走进 Minio - 知乎 (zhihu.com)
二、MinIO集群参数对比
考虑到边缘集群的规模一般比较小,我们采取4节点集群作为对比。其中VPC采用腾讯云高性能网络。考虑对象储存的分布式特点,CPU采用24核心,内存用48GB。
其中IEC为Linux Akraino Type 5中对边缘计算集群的标准配置。
操作系统位ubuntu20.04,软件采取最新版本,安装包都用dpkg标准安装。
采用默认EC:4配置,4节点16盘位。服务启动为标准集群启动模式:
minio server http://min{1...4}.pcie.net:9000/mnt/disk{1...4}/minio
三、功耗参数对比
由于arm架构先天优势,叠加PCIe Net分布式能力,集群功耗降低达到68%。做到功耗基本都消耗在储存硬盘上,能耗利用率达到70%左右,可谓是真正的都花在刀刃上了。
“传统储存架构,由于需要CPU来驱动硬盘阵列,虽然可以通过多盘位方式提高能源利用率,但arm架构明显存在天然优势。PCIe Net将arm架构优势进一步发挥,至少提供多达30%以上能耗优势。”
四、PCIe Net架构对网络层改造
由于PCIe Net是链路层技术,应用层无感,我们对比传统以太网(ethernet)和PCIe Net的云原生集群架构图。
从网络架构图看出,PCIe Net的核心是去掉了NIC模块,将CPU集群直接互联,组建PCIe Net网络。
五、测试结果
由于能耗优势高达10倍左右,很多客户担心性能有没有影响。测试结果如下:
PCIe Net + arm平台8M对象文件读写结果
PCIe Net + arm平台64M对象文件读写结果
Ethernet + x86平台8M对象文件读写结果
Ethernet + x86平台64M对象文件读写结果
测试结果看出,在同样ssd和计算核心条件下,arm架构虽然主频不足,但性能相差不大,特别是PUT(写)性能基本一致。GET(读)性能的差异应该来自arm cpu L3 cache 才4m的,x86 cpu L3 cache达到20MB的原因。
最后我们将每瓦能耗支持的储存IO速率称为储存行业“碳价比”,在PCIe Net技术加持下,arm架构将发挥高达7倍的“碳价比”提升。
六、One more thing
上述结果我们看出低功耗arm和可扩展性的PCIe Net架构将极大的提升分布式储存的“碳价比”。下一步我们将充分发挥arm多核心优势,和对象储存原生支持lambda的优势,构建 Lambda + minIO的分布式流处理数据平台。
文章来源:Socnoc
作者:LEO
推荐阅读
更多Arm服务器相关技术及移植干货请关注Arm服务器专栏。如要加入Arm Server微信群,请添加极术小姐姐(微信id:aijishu20)备注Arm服务器邀请加入。