17 天前
PP-PicoDet:面向移动设备的更优实时目标检测模型
Guanghua Yu, Qinyao Chang, Wenyu Lv, Chang Xu, Cheng Cui, Wei Ji, Qingqing Dang, Kaipeng Deng, Guanzhong Wang, Yuning Du, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma

摘要
在目标检测领域,精度与效率之间的权衡始终是一个具有挑战性的问题。本文致力于研究目标检测中的关键优化方法与神经网络架构设计,以提升模型的精度与效率。我们探讨了无锚框(anchor-free)策略在轻量级目标检测模型中的适用性,通过改进主干网络结构并设计轻量化颈部结构,显著增强了网络的特征提取能力。同时,我们优化了标签分配策略与损失函数,使训练过程更加稳定高效。基于上述改进,我们提出了一类全新的实时目标检测模型家族——PP-PicoDet,该系列模型在移动端目标检测任务中表现出卓越性能。相较于现有主流模型,PP-PicoDet在精度与延迟之间实现了更优的平衡。其中,PicoDet-S 模型仅包含 0.99M 参数,在输入尺寸为 320 时,达到 30.6% 的 mAP,相比 YOLOX-Nano 实现了绝对提升 4.8% 的 mAP,同时将移动端 CPU 推理延迟降低 55%;相较于 NanoDet,mAP 提升达 7.1%。在移动端 ARM CPU 上,其推理速度可达 123 FPS(使用 Paddle Lite 时可达 150 FPS)。PicoDet-L 模型仅需 3.3M 参数,即可达到 40.9% 的 mAP,相比 YOLOv5s 实现了绝对 3.7% 的 mAP 提升,且推理速度提升 44%。如图1所示,我们的模型在轻量级目标检测任务中显著优于当前最先进的方法。相关代码与预训练模型已开源,详见:https://github.com/PaddlePaddle/PaddleDetection。