Happy · 2022年11月08日 · 北京市

PP-YOLOE-R | 手把手教你将PP-YOLOE用于旋转目标检测,顺带达成SOTA性能!

image.png

arXiv:https://arxiv.org/abs/2211.02386
code: https://github.com/PaddlePaddle/PaddleDetection

任意方向目标检测是遥感图像目标检测与自然场景文字检测中最基本的任务。本文提出了一种高效的Anchor-free 旋转目标检测方案PP-YOLOE-R,通过引入大量的有用tricks,所提方案达成如下性能(DOTA1.0):

  • 单尺度训练/测试:PP-YOLOE-R-l/x分别取得了78.14mAP与78.28mAP
  • 多尺度训练/测试:PP-YOLOE-R-l/x分别取得了80.02mAP与80.73mAP.

总而言之,PP-YOLOE-R超过了所有Anchor-free方案,具有与两阶段Anchor-based方案相当的性能。此外,PP-YOLOE-R具有部署友好特性,在TensorRT与FP16加持下,PP-YOLOE-R-s/m/l/x在RTX2080Ti上推理速度可达69.8/55.1/48.3/37.1FPS。与其他方案的性能对比可参考下图。

image.png

本文方案

image.png
上图给出了PP-YOLOE_R架构示意图,与PP-YOLOE整体架构类似,可以理解为:PP-YOLOE-R是PP-YOLOE针对旋转目标检测任务进行的适配与升级。

image.png

image.png
image.png
此外,作者还尝试将ProbIoU损失替换为KLD损失(它具有尺度不变性,非常适用于Anchor-free方案),但是出现了大幅性能下降,见上表。

image.png

上图给出了本文方案与其他旋转目标检测方案的性能对比,可以看到:

  • 单尺度训练/测试:PP-YOLOE-R-l/x分别取得了78.14mAP与78.28mAP,几乎超越了其他所有旋转目标检测;
  • 多尺度训练/测试:PP-YOLOE-R-l/x分别取得了80.02mAP与80.73mAP。PP-YOLOE-x超越了所有Anchor-free方案,仅比两阶段Anchor-based最优方案低0.2mAP。
  • 多尺度训练/测试:PP-YOLOE-R-s与PP-YOLOE-R-m可以取得79.42mAP与79.71mAP,同样是非常优异的结果(考虑到参数量与FLOPs)。

值得一提的是,在保持高性能的同时,PP-YOLOE-R并未使用特殊的算子(如DeformConv、Rotated RoI Align),这使得它可以在不同硬件平台上进行部署,PP-YOLOE-R可以轻松的采用TensorRT进行加速,而其他SOTA方案大部分不支持TensorRT加速。当输入为*,开启FP16后,PP-YOLOE-R-s/m/l/x在RTX2080Ti上推理速度可达69.8/55.1/48.3/37.1FPS

来源:AIWalker
作者: random

推荐阅读

本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏AIWalker。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。
推荐阅读
关注数
6197
内容数
191
夯实深度学习知识基础, 涵盖动态滤波,超分辨,轻量级框架等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息