11 天前

无需分组的基于Transformer的3D目标检测

Ze Liu, Zheng Zhang, Yue Cao, Han Hu, Xin Tong
无需分组的基于Transformer的3D目标检测
摘要

近年来,直接从三维点云中检测三维物体受到了越来越多的关注。现有方法通常通过点分组(point grouping)步骤,将点云中的点分配给候选物体,以便利用类似PointNet的网络从分组后的点中提取物体特征。然而,由于手工设计的分组策略可能导致点分配不准确,从而降低了三维物体检测的性能。本文提出了一种简单而有效的方法,可直接从三维点云中检测三维物体。与传统方法中将局部点分组到每个候选物体不同,我们的方法借助Transformer中的注意力机制(attention mechanism)\cite{vaswani2017attention},从点云中的所有点中联合计算物体特征,网络在训练过程中自动学习每个点对物体特征的贡献程度。通过改进的注意力堆叠(attention stacking)策略,该方法能够在不同网络阶段融合物体特征,从而生成更精确的检测结果。在不依赖复杂组件的情况下,所提出的方法在两个广泛使用的基准数据集ScanNet V2和SUN RGB-D上均取得了当前最优的三维物体检测性能。代码与模型已公开发布于 \url{https://github.com/zeliu98/Group-Free-3D}。

无需分组的基于Transformer的3D目标检测 | 最新论文 | HyperAI超神经