11 天前

MonoUNI:一种具备充分深度线索的统一车端与路侧单目3D目标检测网络

MonoUNI:一种具备充分深度线索的统一车端与路侧单目3D目标检测网络
摘要

车载与基础设施侧的单目3D检测是自动驾驶领域的两个重要研究方向。由于传感器安装方式与焦距存在多样性,研究人员在构建针对这两个方向的算法时,需依赖不同的先验知识,面临显著挑战。本文针对俯仰角与焦距的多样性,提出一种统一的优化目标——归一化深度(normalized depth),实现了对车侧与基础设施侧3D检测问题的统一建模。为进一步提升单目3D检测的精度,本文引入障碍物的3D归一化立方体深度(3D normalized cube depth),以增强模型对深度信息的学习能力。我们提出,深度线索的丰富程度是影响车侧与基础设施侧检测性能的关键因素;更丰富的深度线索有助于模型习得更优的空间理解能力,而3D归一化立方体深度恰好提供了充分的深度信息。大量实验验证了所提方法的有效性。在不引入任何额外信息的前提下,本文提出的MonoUNI方法在五个广泛应用的单目3D检测基准上均取得了当前最优性能,涵盖基础设施侧的Rope3D与DAIR-V2X-I,车侧的KITTI与Waymo,以及跨数据集评估的nuScenes。

MonoUNI:一种具备充分深度线索的统一车端与路侧单目3D目标检测网络 | 最新论文 | HyperAI超神经