首发：AI公园公众号
作者：Tony Shin
编译：ronghuaiyang

导读

对CBNet进行了一个直观的介绍。
https://towardsdatascience.co...
论文：https://arxiv.org/pdf/1909.03...
代码：https://github.com/PKUbahuang...
CBNet在COCO测试数据集上的平均精度为53.3。

作者声称，使用一个更强大的主干可以提高目标检测器的性能。为了做到这一点，他们提出了一种新的策略，即通过相邻主干之间的组合连接来组装多个相同的主干。通过这样做，他们提出了一个更强大的主干，称为组合主干网络。

如上图所示，CBNet由多个相同的骨干网和相邻骨干网之间的组合连接组成。从左到右，每个阶段的输出都在一个辅助主干中，这也可以看作是更高层次的特征。每个特征层的输出通过组合连接流到后续主干网的并行阶段，作为输入的一部分。这样，多个高级和低级特征被融合，以产生更丰富的特征表示。
本文介绍了双主干网(DB)和三主干网(TB)两种体系结构。从命名中可以猜到，DB由两个相同的骨干组成，而TB由三个相同的骨干组成。性能差异将在后面的文章中讨论。
为了从主干中生成多个输出，本文引入了一个组合连接块。这个块由一个1x1卷积和一个批处理归一化层组成。添加这些层是为了减少通道的数量并执行一个upsample操作。
最后的主干(位于图中最右边)，被命名为主主干，用于目标检测。前面的骨干的输出特征被送入RPN/检测头，而每个辅助骨干的输出被送入相邻的骨干。

组合的形式

还有四种组合样式。

相邻的更高层次的组合是前面部分中解释的风格。使用组合连接块将来自辅助骨干网的每个输出特征馈入相邻骨干网。
相同层次的组合是另一种简单的组合样式，它将前一骨干的相邻较低级阶段的输出提供给后续骨干。如图所示，此样式没有使用组合连接块。来自较低层次主干网的特征直接添加到邻近的主干网中。
相邻的低层的组合与AHLC非常相似。唯一的区别是来自前主干较低级阶段的特征被传递到后来的主干。
密集的高层的组合的灵感来自于DenseNet的paper，其中每一层都与随后的所有层连接，在一个stage上建立密集的连接。

上面的表格展示了不同组合风格之间的对比。我们可以观察到AHLC样式优于其他复合样式。这背后的原因在论文中得到了很好的解释。作者认为，将前一个主干的低层特征直接添加到后续主干的高层特征中会损害后一个特征的语义信息。另一方面，在后续主干的浅层特征基础上增加前一主干的深层特征，可以增强后一主干特征的语义信息。