2달 전

강화된 축 세분화 네트워크를 이용한 단일 카메라 3D 객체 검출

Lijie Liu; Chufan Wu; Jiwen Lu; Lingxi Xie; Jie Zhou; Qi Tian
강화된 축 세분화 네트워크를 이용한 단일 카메라 3D 객체 검출
초록

단일 카메라 3D 객체 검출은 2D 입력 이미지에서 객체의 3D 위치와 속성을 추출하는 것을 목표로 합니다. 이는 깊이 정보를 무시하는 카메라로 인한 정보 손실이 주요 어려움인 불완전 문제입니다. 기존 접근 방식은 공간에서 3D 바운딩 박스를 샘플링하고, 대상 객체와 각각의 관계를 추론하지만, 효과적인 샘플의 확률은 3D 공간에서 상대적으로 낮습니다. 샘플링 효율성을 개선하기 위해, 초기 예측부터 시작하여 단계적으로 진실값으로 점진적으로 수정하는 방법을 제안합니다. 각 단계에서 하나의 3D 매개변수만 변경됩니다. 이를 위해서는 여러 단계 후에 보상을 받는 정책을 설계해야 하므로, 강화 학습을 사용하여 이를 최적화합니다. 제안된 프레임워크인 강화 축 세부 조정 네트워크(Reinforced Axial Refinement Network, RAR-Net)는 기존의 단일 카메라 3D 검출 방법에 자유롭게 통합될 수 있는 후처리 단계로 작동하며, KITTI 데이터셋에서 작은 추가 계산 비용으로 성능을 향상시킵니다.

강화된 축 세분화 네트워크를 이용한 단일 카메라 3D 객체 검출 | 최신 연구 논문 | HyperAI초신경