爱笑的小姐姐 · 2022年08月15日 · 北京市

腾讯手部姿态估计论文NSRM

腾讯AI Lab在2020年的paper,核心思想就是利用2D手部关键点标注生成语义分割标注,监督一个语义分割分支,并把该分支的特征图拼接到姿态估计模块里,用于丰富输入特征图的语义信息。

1. 创新点

本文的创新点主要有两个:

  1. 将渲染高斯热图的高斯函数进行了推广,由原本输入一个点渲染的高斯热图,变成了输入一段指节的两头坐标(两个点),渲染得到一块条状的热度图区域。如图所示,左边是固定宽度直接渲染得到的指节,右边是通过高斯函数渲染得到的。

2. 对手指关节热图进行了分组,一共分为6组,由五根手指+手掌关节构成。

2. 细节

  1. 通过本文提出的高斯函数,输入一段指节的两个关节点坐标,渲染得到这段指节的Mask,理论上21个关键点的标注可以生成20段关节。通过把这20段关节分为6组分别进行监督学习,训练一个语义分割的头部,并把这个头部的中间特征图拿出来拼接到姿态估计头部的输入中。
  2. 实验部分对比了将20段关节渲染到一张热图里,和分为6组分别监督,两种方案特征图对实验结果的影响,发现分组后的效果更好。如图是一张图渲染20段关节的效果。

3. 总结

总的来说就是给姿态估计网络增加了一个语义分割模块,我在自己的项目中进行了实验,能观测到微弱的提升,不过好在引入的计算复杂度也不高,并且学到的这个语义分割模块在有些场景下或许能派上用场,也算是承认这篇paper的价值吧。

文章来源:知乎
作者: 镜子

推荐阅读

更多嵌入式AI相关技术干货请关注嵌入式AI专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
18848
内容数
1386
嵌入式端AI,包括AI算法在推理框架Tengine,MNN,NCNN,PaddlePaddle及相关芯片上的实现。欢迎加入微信交流群,微信号:aijishu20(备注:嵌入式)
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息