
摘要
现代3D目标检测器从端到端学习理念中受益匪浅。然而,大多数检测器仅在推理阶段使用一种称为非极大值抑制(Non-Maximal Suppression, NMS)的后处理算法。尽管有人尝试将NMS纳入2D目标检测的训练流程中,但由于NMS缺乏数学表达形式,这些方法并未得到广泛应用。本文提出并集成了GrooMeD-NMS——一种新颖的分组可微非极大值抑制算法,用于单目3D目标检测,使得网络能够在NMS后的边界框上进行端到端训练,并引入损失函数。我们首先将NMS表述为矩阵运算,然后以无监督的方式对边界框进行分组和掩码处理,从而获得NMS的简单闭式表达。GrooMeD-NMS解决了训练和推理流程之间的不匹配问题,因此迫使网络以可微的方式选择最佳的3D边界框。结果表明,GrooMeD-NMS在KITTI基准数据集上的单目3D目标检测性能达到了最先进的水平,并且与基于单目视频的方法相当。代码和模型见:https://github.com/abhi1kumar/groomed_nms