2 个月前

具有不确定性的边界框回归用于精确的目标检测

Yihui He; Chenchen Zhu; Jianren Wang; Marios Savvides; Xiangyu Zhang
具有不确定性的边界框回归用于精确的目标检测
摘要

大规模目标检测数据集(如MS-COCO)试图尽可能清晰地定义真实边界框。然而,我们在标注边界框时观察到仍然存在模糊性。在本文中,我们提出了一种新的边界框回归损失函数,用于同时学习边界框变换和定位方差。该损失函数几乎不增加额外计算量的情况下显著提高了各种架构的定位精度。所学的定位方差使我们能够在非极大值抑制(NMS)过程中合并相邻的边界框,从而进一步提升定位性能。在MS-COCO数据集上,我们将VGG-16 Faster R-CNN的平均精度(AP)从23.6%提高到了29.1%。更重要的是,对于ResNet-50-FPN Mask R-CNN,我们的方法分别将AP和AP90提升了1.8%和6.2%,显著优于以往最先进的边界框精炼方法。我们的代码和模型可在以下地址获取:github.com/yihui-he/KL-Loss