17 天前

用于精确单次检测的并行残差双向融合特征金字塔网络

Ping-Yang Chen, Ming-Ching Chang, Jun-Wei Hsieh, Yong-Sheng Chen
用于精确单次检测的并行残差双向融合特征金字塔网络
摘要

本文提出了一种用于快速且高精度单阶段目标检测的并行残差双向融合特征金字塔网络(Parallel Residual Bi-Fusion Feature Pyramid Network, PRB-FPN)。近年来,特征金字塔(Feature Pyramid, FP)在视觉检测任务中得到广泛应用,然而其传统的自顶向下路径由于池化操作带来的特征偏移,难以有效保持精确的定位能力。随着骨干网络层数加深,FP结构的优势逐渐减弱,且难以同时实现对小目标与大目标的高精度检测。为解决上述问题,本文提出一种新型并行特征金字塔结构,采用双向(自顶向下与自底向上)融合机制,并结合一系列改进设计,以保留高质量特征,提升定位精度。主要贡献包括以下四个方面:(1)设计了一种并行双向融合的特征金字塔结构,引入自底向上的融合模块(Bottom-up Fusion Module, BFM),可同时高精度地检测小目标与大目标;(2)提出一种拼接与重组织(Concatenation and Re-organization, CORE)模块,构建自底向上的特征融合路径,实现双向融合,有效恢复低层特征图中丢失的细节信息;(3)对CORE模块输出的特征进一步进行净化处理,以保留更丰富的上下文信息;该净化过程在自顶向下与自底向上两个路径中均可在少数迭代内完成;(4)在CORE模块中引入残差结构,形成新型的Re-CORE模块,显著提升网络训练稳定性,并可灵活适配多种深层或轻量级骨干网络。实验结果表明,所提出的PRB-FPN在UAVDT17和MS COCO两个基准数据集上均取得了当前最优的检测性能。相关代码已开源,地址为:https://github.com/pingyang1117/PRBNet_PyTorch。