2달 전

M3D-RPN: 단일 카메라 기반 3D 영역 제안 네트워크를 이용한 객체 검출

Brazil, Garrick ; Liu, Xiaoming
M3D-RPN: 단일 카메라 기반 3D 영역 제안 네트워크를 이용한 객체 검출
초록

3D로 세상을 이해하는 것은 도시 자율 주행의 중요한 요소입니다. 일반적으로 성공적인 3D 객체 검출 알고리즘을 위해서는 비싼 LiDAR 센서와 스테레오 RGB 이미징의 조합이 필수적이었으나, 단일 카메라 이미지 방법은 성능이 크게 떨어집니다. 우리는 이 간극을 줄이기 위해 단일 카메라 3D 검출 문제를 독립적인 3D 영역 제안 네트워크로 재정식화하고자 제안합니다. 2D와 3D 시각의 기하학적 관계를 활용하여, 이미지 공간에서 생성된 잘 알려지고 강력한 컨볼루션 특성을 3D 박스가 활용할 수 있도록 합니다. 또한 복잡한 3D 매개변수 추정을 해결하기 위해 깊이 인식 컨볼루션 계층을 설계하여 위치별 특성 개발을 가능하게 하여 결과적으로 향상된 3D 장면 이해를 제공합니다. 이전의 단일 카메라 3D 검출 연구들과 비교할 때, 우리의 방법은 외부 네트워크, 데이터 또는 여러 단계에 의존하지 않고 오직 제안된 3D 영역 제안 네트워크만으로 구성됩니다. M3D-RPN은 KITTI 도시 자율 주행 데이터셋 내에서 단일 카메라 3D 객체 검출과 상공도(鳥瞰圖) 작업 모두의 성능을 크게 향상시키면서 효율적으로 공유 다중 클래스 모델을 사용합니다.

M3D-RPN: 단일 카메라 기반 3D 영역 제안 네트워크를 이용한 객체 검출 | 최신 연구 논문 | HyperAI초신경