焱融科技 · 2023年03月15日 · 北京市

焱融科技发布国内首个NVIDIA DGX A100 + 全闪存储参考架构白皮书

1.jpg

为了不断推进人工智能(AI)、高性能数据分析和 HPC 领域的基础设施,焱融全闪存储解决方案对 NVIDIA® DGX A100 系统 AI 应用进行了性能优化,实现单存储节点达到了40GB/s+ 带宽和 200万+ IOPS 性能,帮助企业成功建设高性能存储平台,使其业务创新迅速进入快车道。

焱融科技作为业界领先的分布式文件存储厂商于近日发布国内首个NVIDIA DGX A100 + 全闪存储参考架构白皮书。NVIDIA® DGX A100 系统是世界上第一个 5Petaflops 的人工智能系统,它将整个数据中心的能力整合到一个灵活的平台上,适用于所有 AI 工作负载,包括分析、训练、推理的通用系统。焱融高性能存储解决方案匹配可扩展的 NVIDIA DGX 环境,整体解决方案集成了焱融追光 F8000X全闪存储系统、NVIDIA® DGX A100 系统和 NVIDIA® Mellanox® InfiniBand 网络系统。基于高扩展性、高性能和大规模的方案设计原则提供全面的优化。

3.jpg

随着 AI、数据分析、HPC 等新型应用的高速发展,企业基于 GPU 的高性能服务器,开发 AI/ML/DL 模型,旨在海量数据中挖掘巨大的商业价值。而达到这个目的核心不仅需要强大的算力(比如当前采用算力非常强劲的 GPU 和 CPU ),而且还需要高速互连和存储系统,让它们能按照算力所需的速度传输数据。这就要求计算平台、共享存储平台以及网络系统以平衡的方式协同工作,且相互性能必须保持高度匹配,才能实现对实时、大规模、多样化数据进行高效的计算分析。所以构建高性能的计算基础架构要同时满足:

2.jpg

焱融追光 F8000X 全闪存储广泛应用于人工智能(AI)、高性能数据分析和 HPC 领域。基于 F8000X 存储的焱融 GPU 集群存储解决方案为 AI 企业用户提供了一个包括共享存储、计算、网络及其他基础架构的规范性解决方案,为 AI、HPC、自动驾驶和其他计算和 I/O 密集型工作而设计。基于可灵活扩展的共享并行架构并经过全面优化,能以高吞吐量、低延迟和大规模并发方式传输数据,为客户带来卓越的性能和经济收益,是匹配 GPU 集群应用场景的理想选择。

该白皮书详细介绍由 NVIDIA DGX A100 GPU 计算系统、 NVIDIA Mellanox QM8700 网络系统和焱融 F8000X 全闪分布式文件存储系统组成的 AI/HPC 计算基础架构。通过测试数据可以看出,焱融 F8000X 能够满足 DGX A100 集群的大规模并发数据访问,并且根据计算集群规模保持同步并线性地扩展性能和容量。有效消除了存储性能瓶颈,充分释放了GPU 计算潜力,轻松应对更重工作负载性能要求。

为了帮助客户确定规模并设计出正确的数据中心架构,焱融全闪文件存储发布基于 NVIDIA DGX A100 新的参考架构。欲了解更多信息,可直接访问:https://www.yanrongyun.com/zh...

推荐阅读
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息