
摘要
在自动驾驶系统中,感知模块负责对周围道路场景进行视觉理解。在各类感知任务中,车辆检测对于实现安全驾驶具有至关重要的意义,因为它能够识别道路上其他交通参与者的位置。本文提出PointRGCN:一种基于图卷积网络(Graph Convolutional Networks, GCNs)的、仅依赖于3D激光雷达点云数据的图结构化3D目标检测框架。为实现更精确的3D目标检测,我们引入一种图表示方法,用于聚合候选区域的特征与上下文信息。在两阶段3D目标检测流程中,我们集成残差图卷积网络(Residual GCNs),利用一种新颖的图结构对3D候选框进行精细化优化。具体而言,R-GCN为残差图卷积网络,负责对3D候选框进行分类与回归;C-GCN则为上下文图卷积网络,通过在多个候选框之间共享上下文信息,进一步提升候选框的精度。我们将上述优化模块整合至一个全新的3D检测框架——PointRGCN中,并在鸟瞰图(bird’s eye view)检测任务的“易”难度级别上取得了当前最优的性能表现。