
摘要
精确的三维目标检测(3DOD)对于自主机器人在复杂环境中实现安全导航至关重要。然而,在杂乱环境中基于稀疏激光雷达(LiDAR)数据回归精确的三维边界框,仍是一项极具挑战性的任务。为此,本文探索了条件能量模型(EBM)在概率回归中的最新进展,以应对该问题。尽管已有基于EBM的回归方法在图像二维目标检测任务中表现出色,但这些技术无法直接应用于三维边界框的回归。因此,本文设计了一种可微分的三维边界框池化操作(differentiable pooling operator),作为EBM网络的核心模块。进一步地,我们将这一通用方法集成至当前最先进的三维目标检测器SA-SSD中。在KITTI数据集上的实验结果表明,所提出的方法在所有3DOD评估指标上均持续优于SA-SSD基线模型,充分展示了基于EBM的回归在实现高精度三维目标检测方面的潜力。代码已开源,地址为:https://github.com/fregu856/ebms_3dod。