2달 전
Disp R-CNN: Shape Prior Guided Instance Disparity Estimation을 통한 스테레오 3D 객체 검출
Sun, Jiaming ; Chen, Linghao ; Xie, Yiming ; Zhang, Siyu ; Jiang, Qinhong ; Zhou, Xiaowei ; Bao, Hujun

초록
본 논문에서는 스테레오 이미지에서 3D 객체 검출을 위한 새로운 시스템인 Disp R-CNN을 제안합니다. 최근의 많은 연구들은 먼저 디스파리티 추정을 통해 포인트 클라우드를 복원한 후 3D 검출기를 적용하여 이 문제를 해결하고 있습니다. 이러한 방법은 전체 이미지에 대해 디스파리티 맵을 계산하므로 비용이 많이 들고, 카테고리별 사전 지식을 활용하지 못하는 단점이 있습니다. 반면에, 우리는 관심 있는 객체의 픽셀만을 대상으로 디스파리티를 예측하고, 더 정확한 디스파리티 추정을 위해 카테고리별 형태 사전 지식을 학습하는 인스턴스 디스파리티 추정 네트워크(iDispNet)를 설계하였습니다.훈련 데이터에서 디스파리티 주석의 부족성에 따른 도전 과제를 해결하기 위해, LiDAR 포인트 클라우드가 필요하지 않은 통계적 형태 모델을 사용하여 밀도 높은 디스파리티 의사-기준 진실(pseudo-ground-truth)을 생성하는 방법을 제안합니다. 이는 우리의 시스템이 더욱 널리 적용될 수 있도록 합니다. KITTI 데이터셋에서 수행된 실험 결과, 훈련 시 LiDAR 기준 진실이 제공되지 않더라도 Disp R-CNN은 경쟁력 있는 성능을 보여주며, 평균 정밀도 측면에서 기존 최신 방법론보다 20% 우수한 성능을 달성하였습니다.