
초록
자율주행 분야에서 차량 측과 인프라 측의 단안 3차원 감지 기술은 두 가지 중요한 주제이다. 다양한 센서 설치 방식과 초점 거리로 인해, 연구자들은 서로 다른 사전 지식을 기반으로 각각의 문제에 대한 알고리즘을 개발해야 하는 도전에 직면해 있다. 본 논문에서는 기울기 각도와 초점 거리의 다양성을 고려하여, 차량 측과 인프라 측의 3차원 감지 문제를 통합할 수 있는 유일한 최적화 목표인 '정규화된 깊이(normalized depth)'를 제안한다. 또한 단안 3차원 감지의 정확도를 향상시키기 위해 장애물의 3차원 정규화 큐브 깊이(3D normalized cube depth)를 도입하여 깊이 정보 학습을 촉진한다. 우리는 깊이 정보의 풍부함이 차량 측과 인프라 측 모두에서 감지 성능에 결정적인 영향을 미친다고 주장한다. 더 풍부한 깊이 정보는 모델이 더 나은 공간 지식을 학습하는 데 도움이 되며, 3차원 정규화 큐브 깊이는 충분한 깊이 정보를 제공한다. 광범위한 실험을 통해 제안한 방법의 효과성을 입증하였다. 추가적인 외부 정보를 도입하지 않음에도 불구하고, 본 연구에서 제안한 방법인 MonoUNI는 차량 측에 대한 KITTI 및 Waymo, 인프라 측에 대한 Rope3D 및 DAIR-V2X-I, 그리고 다중 데이터셋 평가를 위한 nuScenes를 포함한 다섯 가지 널리 사용되는 단안 3차원 감지 벤치마크에서 최신 기술(SOTA) 수준의 성능을 달성하였다.