2달 전
RGB 이미지에서 6D 객체 검출을 위한 암시적 3D 방향 학습
Martin Sundermeyer; Zoltan-Csaba Marton; Maximilian Durner; Manuel Brucker; Rudolph Triebel

초록
우리는 객체 검출 및 6D 포즈 추정을 위한 실시간 RGB 기반 파이프라인을 제안합니다. 우리의 새로운 3D 방향 추정 방법은 도메인 랜덤화를 사용하여 3D 모델의 시뮬레이션 뷰로 훈련된 Denoising Autoencoder의 변형을 기반으로 합니다. 이른바 Augmented Autoencoder는 기존 방법들에 비해 여러 가지 장점이 있습니다: 실제 포즈 주석이 있는 훈련 데이터가 필요하지 않으며, 다양한 테스트 센서에 일반화되고 객체와 뷰의 대칭성을 본질적으로 처리할 수 있습니다. 입력 이미지에서 객체 포즈로의 명시적인 매핑을 학습하는 대신, 잠재 공간에서 샘플로 정의된 객체 방향의 암시적 표현을 제공합니다. 우리의 파이프라인은 T-LESS 데이터셋에서 RGB 및 RGB-D 영역 모두에서 최고 수준의 성능을 달성하였습니다. 또한 LineMOD 데이터셋에서도 다른 합성적으로 훈련된 접근법들과 경쟁할 수 있음을 평가하였습니다. 우리는 객체가 이미지 중심에서 벗어날 때 관점 오류를 보정하여 3D 방향 추정 성능을 더욱 개선하였으며, 확장된 결과를 보여주었습니다.