19 天前

VarifocalNet:一种基于IoU感知的密集目标检测器

Haoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf
VarifocalNet:一种基于IoU感知的密集目标检测器
摘要

准确地对大量候选检测结果进行排序,对于实现高性能的密集目标检测器至关重要。以往的工作通常采用分类得分,或分类得分与预测定位得分的组合来对候选框进行排序。然而,这两种方法均无法提供可靠的排序结果,从而导致检测性能下降。本文提出学习一种IoU感知的分类得分(IoU-aware Classification Score, IACS),作为目标存在置信度与定位精度的联合表示。我们证明,基于IACS,密集目标检测器能够实现更精确的候选检测排序。为此,我们设计了一种新的损失函数——Varifocal Loss,用于训练密集目标检测器以预测IACS,并提出一种新型的星形边界框特征表示方法,用于IACS预测与边界框精修。结合上述两个新组件以及一个边界框精修分支,我们在FCOS+ATSS架构基础上构建了一种IoU感知的密集目标检测器,命名为VarifocalNet(简称VFNet)。在MS COCO数据集上的大量实验表明,无论采用何种主干网络,我们的VFNet均能稳定超越强基准模型约2.0 AP。其中,性能最优的模型VFNet-X-1200(基于Res2Net-101-DCN)在COCO test-dev集上实现了55.1的单模型单尺度AP,达到当前各类目标检测器中的最先进水平。代码已开源,地址为:https://github.com/hyz-xmaster/VarifocalNet。

VarifocalNet:一种基于IoU感知的密集目标检测器 | 论文 | HyperAI超神经