
摘要
三维交通场景包含车辆对象的多种三维信息,如其姿态(pose)与形状(shape)。然而,目前大多数研究对精细形状的重建关注较少,且通常将每个三维物体视为独立个体,导致丢失了物体之间的相对上下文关系以及反映道路环境的场景上下文信息。为此,本文提出一种基于双上下文注意力机制与注意力引导建模(Bi-Contextual Attention and Attention-guided Modeling, BAAM)的新型单目三维姿态与形状重建算法。首先,基于检测到的二维基元(2D primitives),通过注意力引导建模方法重建三维物体形状,该方法综合考虑了检测物体与车辆形状先验之间的相关性;其次,利用双上下文注意力机制估计三维物体姿态,该机制同时融合了物体间的关联上下文以及物体与道路环境之间的场景上下文信息;最后,提出一种基于鸟瞰图(Bird-Eye-View)距离的三维非极大值抑制算法,以有效剔除误检的冗余物体。大量实验表明,所提出的BAAM在ApolloCar3D数据集上达到了当前最优的性能表现;同时实验还证明,BAAM可无缝集成至KITTI数据集上任意成熟的单目三维目标检测器中,并显著提升其检测性能。