2 个月前
ThunderNet:面向实时的通用目标检测
Zheng Qin; Zeming Li; Zhaoning Zhang; Yiping Bao; Gang Yu; Yuxing Peng; Jian Sun

摘要
在移动平台上的实时通用目标检测是一项重要但具有挑战性的计算机视觉任务。然而,以往基于卷积神经网络(CNN)的检测器由于计算成本巨大,难以在计算资源受限的情况下实现实时推理。本文中,我们研究了两阶段检测器在实时通用检测中的有效性,并提出了一种轻量级的两阶段检测器——ThunderNet。在骨干网络部分,我们分析了先前轻量级骨干网络的不足之处,并设计了一种专为对象检测而优化的轻量级骨干网络。在检测部分,我们探索了一种极其高效的区域提议网络(RPN)和检测头的设计。为了生成更具判别力的特征表示,我们设计了两个高效的架构模块:上下文增强模块(Context Enhancement Module)和空间注意力模块(Spatial Attention Module)。最后,我们探讨了输入分辨率、骨干网络和检测头之间的平衡关系。与轻量级单阶段检测器相比,ThunderNet在PASCAL VOC和COCO基准测试中仅以40%的计算成本实现了更优的性能。无需复杂的优化技巧,我们的模型在基于ARM的设备上可达到24.1帧每秒的速度。据我们所知,这是首次在ARM平台上报告的实时检测器。我们的代码和模型可在以下网址获取:\url{https://github.com/qinzheng93/ThunderNet}。