11일 전

자율 주행을 위한 지면 인지 기반 단안 3D 객체 탐지

Yuxuan Liu, Yuan Yixuan, Ming Liu
자율 주행을 위한 지면 인지 기반 단안 3D 객체 탐지
초록

단일 RGB 카메라를 이용하여 환경 내 물체의 3차원 위치 및 방향을 추정하는 것은 저비용 도시 자율 주행 및 모바일 로봇에 있어 핵심적이면서도 도전적인 과제이다. 기존의 대부분의 알고리즘은 2D-3D 대응 관계에서 유도되는 기하학적 제약에 기반하고 있으며, 이는 일반적인 6차원 물체 자세 추정 문제에서 비롯된다. 본 연구에서는 먼저 주행 환경에서 3차원 탐지 과정에서 지면 평면이 깊이 추론에 추가적인 단서를 제공하는 방식을 규명한다. 이러한 관찰을 바탕으로, 3차원 앵커 처리 방식을 개선하고, 딥러닝 프레임워크 내에서 특정 응용 분야의 사전 지식을 최대한 활용할 수 있도록 새로운 신경망 모듈을 제안한다. 마지막으로, 제안된 모듈을 내장한 효율적인 신경망을 3차원 물체 탐지에 적용한다. 또한, 단일 카메라 깊이 예측을 위한 신경망을 설계하여 제안된 모듈의 효과를 추가로 검증한다. 두 가지로 제안된 네트워크는 각각 KITTI 3D 물체 탐지 및 깊이 예측 벤치마크에서 최신 기술 수준의 성능을 달성하였다. 코드는 https://www.github.com/Owen-Liuyuxuan/visualDet3D 에 공개될 예정이다.

자율 주행을 위한 지면 인지 기반 단안 3D 객체 탐지 | 최신 연구 논문 | HyperAI초신경