“15分钟看顶会”是旷视研究院全新推出的论文快速解读专栏,聚焦旷视在全球各大顶会、期刊等平台所发表的工作,覆盖深度学习、计算机视觉、视觉导航与控制、计算摄影学、大规模机器学习系统、机器人学等方向。
与传统论文视频解读动辄30分钟的时长不同,本专栏尽可能将时间控制在15分钟左右,以方便读者在日常通勤、等待、出行等时间受限的场景下高效利用碎片化时间进行学习、交流。
欢迎大家和我们一起“深度学习”,也欢迎对这种论文解读方式提出您的宝贵建议。
本期是“15分钟看顶会”专栏 ECCV 2020 论文解读系列的第七篇,旷视研究院通过在激活函数领域进行创新,提出一种在视觉任务上大幅超越ReLU的新型激活函数Funnel activation(FReLU),简单又高效。
- 论文题目:Funnel Activation for Visual Recognition
- 论文链接:https://arxiv.org/abs/2007.11824
- MegEngine开源:https://github.com/megvii-mod...
- 关键词:funnel 激活函数、视觉识别、CNN
具体而言,旷视研究院通过增加可忽略的空间条件开销将ReLU和PReLU扩展为2D激活函数。ReLU和PReLU分别表示为y = max(x,0)和y = max(x,px)的形式,而FReLU的形式为y = max(x,T(x)),其中T(·)是二维空间条件(2D spatial condition)。
此外,空间条件以简单的方式实现了像素级建模能力,并通过常规卷积捕获了复杂的视觉layouts。最后,对ImageNet数据集、COCO数据集检测任务和语义分割任务进行了实验,展示了FReLU激活函数在视觉识别任务中的巨大改进和鲁棒性。
同学们还可以点击阅读原文,浏览《ECCV 2020 旷视研究院15篇成果总览》,了解更多顶会论文内容。
专栏文章推荐
欢迎关注旷视研究院极术社区专栏,定期更新最新旷视研究院成果
加入旷视:career@megvii.com