【爱集微点评】格灵深瞳公开的基于深度学习的高铁检修、监测方案,基于深度学习的无监督异常检测的方法,只需要提供正常的数据进行训练。利用训练好的无监督学习的归一化流异常检测模型,即可得到异常物体在高铁检修图像上的位置,以解决传统的高铁检修中由于异常数据获取困难,导致训练的高铁检修模型识别异常准确性较低的技术问题。
集微网消息,近年来,人工智能在全球范围内迅速落地应用,广泛地应用到了我们生活的方方面面。深度学习的异常检测技术:主要用于检测异常物体在2D图片上的位置,深度学习无监督学习方法如PatchCore、PaDiM和DifferNet等。深度学习监督学习目标检测方法如Faster R‑CNN、Yolo v5以及DETR等。
现有的高铁检修大部分依赖于人工对高铁是否存在异常的物体进行异常检测,少部分情况基于深度学习的监督学习的检测方法依赖实际场景人工模拟异常。并且需要对采集的异常数据进行人工标注,然后使用监督学习的目标检测方法进行异常检测。
传统采用人工检修的方式,不仅检修人员的工作环境恶劣,而且成本高、效率低。基于深度学习的检修方式,虽然能够在一定程度上实现较好的效果,但是需要人工对采集数据进行标注,标注成本大,而且无法模拟出全部的异常物体类型,可能会导致无法成功检测的情况,从而造成高铁运行的重大事故。
为此,格灵深瞳在2022年8月29日申请了一项名为“一种用于高铁检修的监测方法以及装置”的发明专利(申请号:202211038266.6),申请人为北京格灵深瞳信息技术股份有限公司。
根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。
如上图,为该专利中公开的用于高铁检修监测方法的流程图。首先,获取采集高铁目标位置的目标图像。其次,基于目标图像利用深度卷积神经网络从样本图像中提取特征图。最后,将特征图输入到目标检测模型中,确定目标图像是否存在异常。其中,目标检测模型是基于未出现异常的样本图像进行训练,直至样本图像的分布拟合到标准正态分布当中,则结束检测模型的训练,得到目标检测模型。
该模型中使用一维归一化流模型进行异常检测,归一化流模型的作用机制为只对正常数据进行训练,可以将正常图像的分布拟合到标准正态分布当中。在进行测试时,对于图像中异常的区域,则会被模型拟合到另一个分布。因此只需要设置一个经验阈值,就可以将正常与异常区域分开。
如上图,为上述基于流模型的高铁检修无监督异常检测方法的结构框图。首先,机器人调整摄像头和光源,采集目标设备的清晰图像数据,并进行图像增强处理。其次,利用深度卷积神经网络Wide‑Resnet50来进行图像特征提取。Wide‑Resnet50作为一个特征提取网络,相比于传统的ResNet网络,该网络使用一种较浅的,并在每个单层上更宽的(维度)模型来提升模型性能。
如上图所示,为特征提取模块结构示意图。特征提取模块wide‑Resenet 50图像金字塔,每一层的数据将输入至归一化流模型。将图像增强后的图像线性下采样到长宽相同的(1024,1024)的尺寸,然后经过Wide‑Resnet 50进行特征提取。采用图像金字塔的方式,取通过卷积神经网络下采样得到8倍、16倍、32倍的特征图,分别输入到无监督学习异常检测流模型模块中进行训练和测试。
接着,使用一维归一化流模型进行异常检测,归一化流模型的作用机制为只对正常数据进行训练,可以将正常图像的分布拟合到标准正态分布当中。并利用多尺度聚合模块,将得分在每一个尺度下的异常检测结果再次归一化到[0,1]之间,对其进行加和。
此时得到的新的异常检测得分图每个位置异常检测结果为[0,3]之间的得分,然后取最大值,并减去每一个位置的异常得分,得到不同测试图像的相对异常检测得分作为最终的异常检测结果。
如上图,为上述用于高铁检修的监测装置图。该装置包括:获取单元71、提取单元73和第一确定单元75。获取单元用于获取采集高铁目标位置的目标图像。提取单元用于基于目标图像利用深度卷积神经网络从样本图像中提取特征图。第一确定单元用于将特征图输入到目标检测模型中,确定目标图像是否存在异常。
以上就是格灵深瞳公开的基于深度学习的高铁检修、监测方案,该方案基于深度学习的无监督异常检测的方法,只需要提供正常的数据进行训练。利用训练好的无监督学习的归一化流异常检测模型,即可得到异常物体在高铁检修图像上的位置,以解决传统的高铁检修中由于异常数据获取困难,导致训练的高铁检修模型识别异常准确性较低的技术问题。