焱融科技发布国内首个NVIDIA DGX A100 + 全闪存储参考架构白皮书

为了不断推进人工智能（AI）、高性能数据分析和 HPC 领域的基础设施，焱融全闪存储解决方案对 NVIDIA® DGX A100 系统 AI 应用进行了性能优化，实现单存储节点达到了40GB/s+ 带宽和 200万+ IOPS 性能，帮助企业成功建设高性能存储平台，使其业务创新迅速进入快车道。

焱融科技作为业界领先的分布式文件存储厂商于近日发布国内首个NVIDIA DGX A100 + 全闪存储参考架构白皮书。NVIDIA® DGX A100 系统是世界上第一个 5Petaflops 的人工智能系统，它将整个数据中心的能力整合到一个灵活的平台上，适用于所有 AI 工作负载，包括分析、训练、推理的通用系统。焱融高性能存储解决方案匹配可扩展的 NVIDIA DGX 环境，整体解决方案集成了焱融追光 F8000X全闪存储系统、NVIDIA® DGX A100 系统和 NVIDIA® Mellanox® InfiniBand 网络系统。基于高扩展性、高性能和大规模的方案设计原则提供全面的优化。

随着 AI、数据分析、HPC 等新型应用的高速发展，企业基于 GPU 的高性能服务器，开发 AI/ML/DL 模型，旨在海量数据中挖掘巨大的商业价值。而达到这个目的核心不仅需要强大的算力（比如当前采用算力非常强劲的 GPU 和 CPU ），而且还需要高速互连和存储系统，让它们能按照算力所需的速度传输数据。这就要求计算平台、共享存储平台以及网络系统以平衡的方式协同工作，且相互性能必须保持高度匹配，才能实现对实时、大规模、多样化数据进行高效的计算分析。所以构建高性能的计算基础架构要同时满足：

焱融追光 F8000X 全闪存储广泛应用于人工智能（AI）、高性能数据分析和 HPC 领域。基于 F8000X 存储的焱融 GPU 集群存储解决方案为 AI 企业用户提供了一个包括共享存储、计算、网络及其他基础架构的规范性解决方案，为 AI、HPC、自动驾驶和其他计算和 I/O 密集型工作而设计。基于可灵活扩展的共享并行架构并经过全面优化，能以高吞吐量、低延迟和大规模并发方式传输数据，为客户带来卓越的性能和经济收益，是匹配 GPU 集群应用场景的理想选择。

该白皮书详细介绍由 NVIDIA DGX A100 GPU 计算系统、 NVIDIA Mellanox QM8700 网络系统和焱融 F8000X 全闪分布式文件存储系统组成的 AI/HPC 计算基础架构。通过测试数据可以看出，焱融 F8000X 能够满足 DGX A100 集群的大规模并发数据访问，并且根据计算集群规模保持同步并线性地扩展性能和容量。有效消除了存储性能瓶颈，充分释放了GPU 计算潜力，轻松应对更重工作负载性能要求。

为了帮助客户确定规模并设计出正确的数据中心架构，焱融全闪文件存储发布基于 NVIDIA DGX A100 新的参考架构。欲了解更多信息，可直接访问：https://www.yanrongyun.com/zh...。

推荐阅读

目录