NVIDIA® DGX 系统加速银河水滴步态识别AI模型训练

背景

常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。其中,步态识别技术可以通过人的身体体型和行走姿态来辨识身份,它是目前远距离复杂场景下几乎唯一可用于身份识别的生物特征识别技术。
 title=

银河水滴科技有限公司(以下简称为“银河水滴”)源自于中科院自动化所,是步态识别技术和产业的引领者,致力于将此技术与行业应用深度融合。在对步态识别AI模型进行训练时,银河水滴部署了包含8块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1™ 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速步态识别技术在刑侦、安防、人群密度监控等领域的应用落地。

挑战

步态识别面临着极具挑战的复杂环境——远距离、跨视角、跨着装、低照度、全天候,是极具挑战、但又及其重要的科技难题,是公认的当前视频大数据解析与应用的核心技术之一。由于其数据环境复杂,因而所需要处理的数据种类繁多。

为了在步态识别过程中通过深度学习方法处理视角、着装、携带物等多种行人特征的同时,保持所生成步态序列的不变性,银河水滴所需处理的数据量十分庞大,因而AI模型的训练数据吞吐量大、整体训练速度偏慢,亟需寻找更强大的 GPU 解决方案以更高效地从步态序列中提取更具鲁棒性的特征。

方案

在步态识别AI模型训练中,需要通过 GPU 对大量数据进行传输与计算。英迈中国及其资深合作伙伴宝德协助银河水滴试用了 NVIDIA DGX-1 系统,NVIDIA DGX-1 所具有的高带宽可以大幅加速数据搬运的过程给银河水滴留下了深刻的印象。最终,为了进一步加速步态识别AI模型训练,银河水滴选择部署了 NVIDIA DGX-1 深度学习服务器以满足高计算需求。

NVIDIA DGX-1 是⼀款深度学习系统,专为实现⾼吞吐量和⾼互联带宽⽽构建,可极⼤提升神经⽹络训练性能。其系统核⼼组件是 8 个 NVIDIA V100 GPU,通过混合⽴体 NVLink ⽹络拓扑互联。除了这 8 个 GPU 之外,NVIDIA DGX-1 还内置两块 CPU 以供启动、存储管理及深度学习框架协调之⽤。NVIDIA DGX-1 内嵌于 3 机架单位(3U)机箱中,集电源、冷却、⽹络、多系统互联及 SSD ⽂件系统缓存于⼀体,各组件相互协调,能够优化吞吐量和深度学习训练时间。通过部署 NVIDIA DGX-1 系统,银河水滴取得了比单独部署 GPU 更强大的性能。

在模型训练过程中银河水滴的技术人员发现,NVIDIA DGX-1 可以协助充分发挥 NVIDIA 数据中心 GPU 的潜力。银河水滴在对其模型进行每100次迭代时,此前通过单独采用配置了8 块 NVIDIA V100 GPU 的服务器所需的训练时间是2分40秒,而在包含8块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统中,这一过程则只需花费1分40秒,缩短了近40%的训练时间。

影响

目前,银河水滴的步态识别技术已在全国各地几十个城市落地,在对步态识别AI模型进行训练时,部署了包含8块 NVIDIA V100 数据中心 GPU 的 NVIDIA DGX-1 系统,通过强劲算力处理多阶段、多种类、多用途的大量数据,加速了银河水滴步态识别技术的应用落地。NVIDIA DGX-1 系统所具有的革命性 AI 性能也将继续提高银河水滴的 AI 模型训练效率,以助力经过充分迭代的深度学习模型应用至更多场景中。

今后,银河水滴将持续深耕智能视频分析领域,以先进的人工智能技术提升视频数据价值,领跑数智视频新基建大赛道。而英迈将继续致力于向合作伙伴及客户提供更优的深度学习解决方案,结合 NVIDIA 数据中心 GPU 的不断进化及 DGX 系统的升级,通过 AI 基础架构的性能飞跃助力各行各业,帮助客户部署即插即⽤的超高性能深度神经⽹络训练平台,引领客户在深度学习工作负载方面保持竞争优势。

 title=

2 阅读 171
推荐阅读
关注数
2348
文章数
266
申耀的科技观察微信公众号官方运营
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息