arXiv:https://arxiv.org/abs/2211.02386
code: https://github.com/PaddlePaddle/PaddleDetection
任意方向目标检测是遥感图像目标检测与自然场景文字检测中最基本的任务。本文提出了一种高效的Anchor-free 旋转目标检测方案PP-YOLOE-R,通过引入大量的有用tricks,所提方案达成如下性能(DOTA1.0):
- 单尺度训练/测试:PP-YOLOE-R-l/x分别取得了78.14mAP与78.28mAP;
- 多尺度训练/测试:PP-YOLOE-R-l/x分别取得了80.02mAP与80.73mAP.
总而言之,PP-YOLOE-R超过了所有Anchor-free方案,具有与两阶段Anchor-based方案相当的性能。此外,PP-YOLOE-R具有部署友好特性,在TensorRT与FP16加持下,PP-YOLOE-R-s/m/l/x在RTX2080Ti上推理速度可达69.8/55.1/48.3/37.1FPS。与其他方案的性能对比可参考下图。
本文方案
上图给出了PP-YOLOE_R架构示意图,与PP-YOLOE整体架构类似,可以理解为:PP-YOLOE-R是PP-YOLOE针对旋转目标检测任务进行的适配与升级。
此外,作者还尝试将ProbIoU损失替换为KLD损失(它具有尺度不变性,非常适用于Anchor-free方案),但是出现了大幅性能下降,见上表。
上图给出了本文方案与其他旋转目标检测方案的性能对比,可以看到:
- 单尺度训练/测试:PP-YOLOE-R-l/x分别取得了78.14mAP与78.28mAP,几乎超越了其他所有旋转目标检测;
- 多尺度训练/测试:PP-YOLOE-R-l/x分别取得了80.02mAP与80.73mAP。PP-YOLOE-x超越了所有Anchor-free方案,仅比两阶段Anchor-based最优方案低0.2mAP。
- 多尺度训练/测试:PP-YOLOE-R-s与PP-YOLOE-R-m可以取得79.42mAP与79.71mAP,同样是非常优异的结果(考虑到参数量与FLOPs)。
值得一提的是,在保持高性能的同时,PP-YOLOE-R并未使用特殊的算子(如DeformConv、Rotated RoI Align),这使得它可以在不同硬件平台上进行部署,PP-YOLOE-R可以轻松的采用TensorRT进行加速,而其他SOTA方案大部分不支持TensorRT加速。当输入为*,开启FP16后,PP-YOLOE-R-s/m/l/x在RTX2080Ti上推理速度可达69.8/55.1/48.3/37.1FPS。
来源:AIWalker
作者: random
推荐阅读
- 重磅干货|低光图像处理方案
- VapSR | 手把手教你改进PAN,董超团队提出超大感受野注意力超分方案,已开源!
- SwinFIR | 超分领域的"ConvNeXt",值得一看
- 全新范式 | 沈春华老师团队提出无需解码器的目标检测器DFFT
本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏AIWalker。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。