2 个月前

M2Det:基于多级特征金字塔网络的单次物体检测器

Qijie Zhao; Tao Sheng; Yongtao Wang; Zhi Tang; Ying Chen; Ling Cai; Haibin Ling
M2Det:基于多级特征金字塔网络的单次物体检测器
摘要

特征金字塔在最先进的单阶段目标检测器(如DSSD、RetinaNet、RefineDet)和两阶段目标检测器(如Mask R-CNN、DetNet)中被广泛利用,以缓解不同目标实例间尺度变化带来的问题。尽管这些带有特征金字塔的目标检测器取得了令人鼓舞的结果,但由于它们仅根据骨干网络固有的多尺度、金字塔结构简单构建特征金字塔,而这些骨干网络实际上是为了对象分类任务设计的,因此存在一些局限性。在这项工作中,我们提出了一种称为多级特征金字塔网络(MLFPN)的方法,用于构建更有效的特征金字塔,以检测不同尺度的目标。首先,我们将骨干网络提取的多级特征(即多个层)融合为基底特征。其次,将基底特征输入到由交替连接的稀疏U形模块和特征融合模块组成的块中,并利用每个U形模块的解码层作为目标检测的特征。最后,我们将具有相同尺度(大小)的解码层汇集起来,开发出一个用于目标检测的特征金字塔,在该金字塔中每个特征图都包含来自多个层次的层(特征)。为了评估所提出的MLFPN的有效性,我们设计并训练了一个强大的端到端单阶段目标检测器——M2Det,通过将其集成到SSD架构中来实现更好的检测性能。具体而言,在MS-COCO基准测试中,M2Det在单尺度推理策略下达到了11.8 FPS的速度和41.0的AP值,在多尺度推理策略下则达到了44.2的AP值,这是目前单阶段检测器中的最新最佳结果。代码将在\url{https://github.com/qijiezhao/M2Det}上公开提供。