2 个月前

R-FCN:基于区域的全卷积网络进行目标检测

Jifeng Dai; Yi Li; Kaiming He; Jian Sun
R-FCN:基于区域的全卷积网络进行目标检测
摘要

我们提出了一种基于区域的全卷积网络,用于实现准确且高效的物体检测。与之前的基于区域的检测器(如Fast/Faster R-CNN)不同,这些检测器需要对每个区域应用一个计算成本较高的子网络数百次,而我们的基于区域的检测器几乎在整个图像上共享了所有计算,实现了全卷积化。为了达到这一目标,我们提出了位置敏感得分图(position-sensitive score maps),以解决图像分类中的平移不变性和物体检测中的平移变异性之间的矛盾。因此,我们的方法可以自然地采用最新的全卷积图像分类骨干网络,例如残差网络(ResNets),进行物体检测。我们在PASCAL VOC数据集上展示了具有竞争力的结果(例如,在2007数据集上达到了83.6%的平均精度均值mAP),使用的是101层的ResNet。同时,我们的方法在测试时每张图像的速度为170毫秒,比Faster R-CNN快2.5到20倍。代码已公开发布在:https://github.com/daijifeng001/r-fcn