
초록
대규모 포인트 클라우드에서의 재위치 결정을 위해, 우리는 전역 장소 인식과 국부적 6자유도(6DoF) 포즈 정교화를 통합하는 첫 번째 접근 방식을 제안합니다. 이를 위해, 우리는 원시 3D 점들로부터 직접 3D 국부적 특징 검출과 설명을 공동으로 학습하는 시아메즈 네트워크(Siamese network)를 설계하였습니다. 이 네트워크는 FlexConv와 Squeeze-and-Excitation(SE)을 통합하여 학습된 국부적 설명자가 다중 수준의 기하학적 정보와 채널별 관계를 포착하도록 보장합니다. 3D 키포인트 검출을 위해, 우리는 비지도 방식으로 국부적 설명자의 차별성을 예측합니다. 효과적인 주의 메커니즘을 사용하여 학습된 국부적 설명자를 직접 집계하여 전역 설명자를 생성합니다. 이렇게 하면, 단일 순방향 패스에서 국부적 및 전역 3D 설명자가 추론됩니다. 다양한 벤치마크에서 수행한 실험은 우리의 방법이 최신 접근 방식에 비해 전역 포인트 클라우드 검색과 국부적 포인트 클라우드 등록 모두에서 경쟁력 있는 결과를 달성함을 보여줍니다. 또한, 우리의 3D 키포인트의 일반화 능력과 견고성을 검증하기 위해, 시각 SLAM 시스템에서 생성된 포인트 클라우드 등록에서도 미세 조정 없이 유리한 성능을 보임을 입증하였습니다. 코드와 관련 자료는 https://vision.in.tum.de/research/vslam/dh3d 에서 제공됩니다.