학습을 통한 장면 완성에서 문맥적 형상 사전 정보를 활용한 희소 단일 스캔 LiDAR 포인트 클라우드 분할

LiDAR 포인트 클라우드 분석은 3D 컴퓨터 비전의 핵심 작업이며, 특히 자율 주행 분야에서 중요합니다. 그러나 단일 스윕 LiDAR 포인트 클라우드에서 심각한 희소성과 노이즈 간섭으로 인해 정확한 의미 세분화(semantic segmentation)를 달성하는 것은 쉽지 않습니다. 본 논문에서는 학습된 문맥적 형태 사전(contextual shape priors)을 활용한 새로운 희소 LiDAR 포인트 클라우드 의미 세분화 프레임워크를 제안합니다. 실제 적용에서는 어떤 매력적인 네트워크를 사용하여도 단일 스윕 포인트 클라우드의 초기 의미 세분화(SS)를 수행할 수 있으며, 그 결과가 의미 장면 완성(semantic scene completion, SSC) 모듈의 입력으로 들어갑니다. LiDAR 시퀀스에서 여러 프레임을 통합하여 감독(supervision)으로 사용함으로써 최적화된 SSC 모듈은 순차적인 LiDAR 데이터로부터 문맥적 형태 사전을 학습하여, 희소한 단일 스윕 포인트 클라우드를 밀집한 것으로 완성합니다. 따라서 이는 완전히 엔드투엔드(end-to-end)로 훈련되는 과정에서 본질적으로 SS 최적화를 개선합니다. 또한, Point-Voxel Interaction(PVI) 모듈이 제안되어 SS와 SSC 작업 간의 지식 융합을 더욱 강화하며, 즉 포인트 클라우드의 불완전한 국부 기하학과 복셀(voxel)-별 전역 구조 사이의 상호작용을 촉진합니다. 더불어, 추론(inference) 과정에서는 보조 SSC 및 PVI 모듈이 추가 부담 없이 제거될 수 있습니다. 광범위한 실험 결과, 제안된 JS3C-Net이 SemanticKITTI 및 SemanticPOSS 벤치마크에서 우수한 성능을 보임을 확인하였으며, 각각 4%와 3%의 성능 향상을 달성하였습니다.