2 个月前
用于目标检测的特征金字塔网络
Tsung-Yi Lin; Piotr Dollár; Ross Girshick; Kaiming He; Bharath Hariharan; Serge Belongie

摘要
特征金字塔是识别系统中用于检测不同尺度物体的基本组件。然而,近期的深度学习目标检测器为了避免计算和内存开销较大的问题,部分放弃了金字塔表示方法。在本文中,我们利用了深度卷积网络固有的多尺度、金字塔层次结构,以极小的额外成本构建了特征金字塔。我们开发了一种具有横向连接的自上而下的架构,用于在所有尺度上生成高层次的语义特征图。该架构被称为特征金字塔网络(Feature Pyramid Network, FPN),在多个应用中作为通用特征提取器表现出显著的改进。在基本的Faster R-CNN系统中使用FPN,我们的方法在COCO目标检测基准测试中取得了单模型的最佳结果,无需复杂的调整和优化,超越了包括2016年COCO挑战赛获胜者在内的所有现有单模型记录。此外,我们的方法可以在GPU上以每秒5帧的速度运行,因此是一种实用且准确的多尺度目标检测解决方案。代码将公开发布。