LiDAR 데이터를 활용한 로컬 딥 임의 함수를 이용한 의미적 장면 완성

세마틱 장면 보완은 주어진 영역 내 객체와 표면의 3D 기하학적 구조와 의미 정보를 동시에 추정하는 작업이다. 이는 희박하고 가려진 실세계 데이터에서 특히 도전적인 과제이다. 본 연구에서는 국소적인 딥 암시 함수(Deep Implicit Functions) 기반의 장면 분할 네트워크를 제안하여, 장면 보완을 위한 새로운 학습 기반 방법론을 마련하였다. 기존의 장면 보완 기법들과 달리, 본 방법은 복셀화(Voxelization)에 기반하지 않는 연속적인 장면 표현을 생성한다. 원시 포인트 클라우드는 국소적으로 다양한 공간 해상도에서 잠재 공간(latent space)으로 인코딩되며, 이후 국소적 함수 패치들로부터 전역적인 장면 보완 함수가 구성된다. 본 연구에서는 이러한 연속적 표현이 공간 이산화 없이도 광범위한 실외 장면의 기하학적 및 의미적 특성을 효과적으로 표현할 수 있음을 입증하였다. 이는 장면의 세부 사항 수준과 커버 가능한 장면 범위 사이의 상충 관계를 피할 수 있음을 의미한다.본 연구에서 제안한 방법은 Semantic KITTI 데이터셋의 의미 주석이 부여된 LiDAR 스캔 데이터를 기반으로 학습 및 평가하였다. 실험 결과, 제안한 방법이 주어진 장면에 대한 밀도 높은 3D 기술을 복원할 수 있는 강력한 표현을 생성함을 확인하였다. 또한 Semantic KITTI 장면 보완 벤치마크에서 기하학적 보완의 교차율(Intersection-over-Union, IoU) 기준으로 기존 최고 성능(SOTA)을 능가하는 성능을 달성하였다.