CrossLoc3D: 공중-지상 크로스 소스 3D 장소 인식

우리는 CrossLoc3D라는 새로운 3D 장소 인식 방법을 소개합니다. 이 방법은 크로스 소스 환경에서 대규모 포인트 매칭 문제를 해결합니다. 크로스 소스 포인트 클라우드 데이터는 정확도가 다른 깊이 센서나 서로 다른 거리와 시점에서 캡처된 포인트 집합을 의미합니다. 우리는 서로 다른 소스에서 캡처된 포인트 간의 표현 차이를 고려한 3D 장소 인식 방법 개발에 대한 도전 과제를 다룹니다. 우리의 방법은 다중 해상도 특징을 활용하고 가장 두드러진 특징에 해당하는 컨볼루션 커널 크기를 선택하여 크로스 소스 데이터를 처리합니다. 확산 모델에서 영감을 받은 우리 방법은 다양한 소스의 임베딩 공간을 단일 표준 공간으로 점진적으로 이동시키는 새로운 반복적 정교화 과정을 사용하여 더 나은 메트릭 학습을 수행합니다.또한, 우리는 CS-Campus3D라는 첫 번째 3D 공중-지상 크로스 소스 데이터셋을 제시합니다. 이 데이터셋은 공중과 지상 LiDAR 스캔으로부터 얻어진 포인트 클라우드 데이터를 포함하며, 표현 차이와 같은 시각, 포인트 밀도, 노이즈 패턴 등의 특성을 가지고 있습니다. 우리는 CrossLoc3D 알고리즘이 CS-Campus3D 벤치마크에서 상위 1개 평균 재현율 측면에서 4.74% - 15.37%의 향상을 보이는 것을 보여주며, 옥스퍼드 로봇카 벤치마크에서는 최신 3D 장소 인식 방법과 유사한 성능을 달성함을 입증하였습니다. 코드와 CS-Campus3D 벤치마크는 github.com/rayguan97/crossloc3d에서 제공될 예정입니다.