旷视研究院 · 2020年09月04日

ECCV 2020 Spotlight,COCO关键点检测冠军算法RSN解析

640.png

“15分钟看顶会”是旷视研究院全新推出的论文快速解读专栏,聚焦旷视在全球各大顶会、期刊等平台所发表的工作,覆盖深度学习、计算机视觉、视觉导航与控制、计算摄影学、大规模机器学习系统、机器人学等方向。

与传统论文视频解读动辄30min时长不同,本专栏尽可能将时间控制在15分钟左右,以方便读者在日常通勤、等待、出行等时间受限的场景下高效利用碎片化时间进行学习、交流。

欢迎大家和我们一起“深度学习”,也欢迎对这种论文解读方式提出您的宝贵建议。

本期是“15分钟看顶会”专栏 ECCV 2020 论文解读系列的第二篇,旷视研究院提出一个全新方法,残差阶梯网络(Residual Steps Network, RSN)。RSN能聚合同一网络阶段输出的特征(intra-level 特征),以获得精准的局部特征表示,该表示保留了丰富的低层空间信息,能够助力网络实现精确的关键点定位。

本文方法在 2019 COCO 关键点检测任务上夺冠,并入选 ECCV 2020 Spotlight 论文。

640-1.png

image.png
查看完整视频

在利用特征融合进行人体关键点检测的现有工作中,人们多以inter-level的特征融合为基本策略,而没有考虑intra-level特征融合能带来的丰富空间信息。为此在本文中,旷视研究院提出残差阶梯网络(Residual Steps Network, RSN),能聚合同一网络阶段输出的特征(intra-level 特征),以获得精准的局部特征表示。

640-2.png

此外,研究人员还提出一个高效的注意力机制——姿态修正机(Pose Refine Machine),它能够在输出特征上平衡局部与全局表示,进一步修正关键点定位效果。在无额外数据与预训练模型的情况下,在COCO与MPII基准数据集上均取得了最佳效果。



专栏文章推荐


欢迎关注旷视研究院极术社区专栏,定期更新最新旷视研究院成果
加入旷视:career@megvii.com
推荐阅读
关注数
7710
内容数
164
专注旷视研究院学术论文解读推送,涵盖计算机视觉,文字识别等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息