16일 전
LiDAR 세그멘테이션을 위한 레인지 뷰 표현의 재고
Lingdong Kong, Youquan Liu, Runnan Chen, Yuexin Ma, Xinge Zhu, Yikang Li, Yuenan Hou, Yu Qiao, Ziwei Liu

초록
LiDAR 세그멘테이션은 자율 주행 인지에 있어 핵심적인 요소이다. 최근의 추세는 기존의 범위 영상(-range view) 표현 방식보다 더 높은 성능을 보이는 포인트 또는 복셀 기반 방법을 선호하고 있다. 본 연구에서는 강력한 범위 영상 모델을 구축하는 데 있어 몇 가지 핵심 요인을 밝혀냈다. 우리는 '다수에서 일대' 매핑, 의미적 불일치, 형상 왜곡 등이 범위 영상 투영에서 효과적인 학습을 방해할 수 있는 가능성을 관찰하였다. 이를 해결하기 위해, 네트워크 아키텍처, 데이터 증강, 후처리에 걸쳐 새로운 설계를 통합한 전주기 프레임워크인 RangeFormer을 제안한다. 이는 범위 영상에서 LiDAR 포인트 클라우드의 학습 및 처리를 보다 효과적으로 수행할 수 있도록 한다. 또한, 임의의 저해상도 2D 범위 영상에서 학습이 가능하면서도 3D 세그멘테이션 정확도를 여전히 만족스럽게 유지할 수 있는 확장 가능한 범위 영상 기반 학습(Scalable Training from Range view, STR) 전략을 도입하였다. 본 연구에서는 처음으로 범위 영상 기반 방법이 SemanticKITTI, nuScenes, ScribbleKITTI 등의 주요 LiDAR 세그멘테이션 및 팔레오판오틱 세그멘테이션 벤치마크에서 포인트 기반, 복셀 기반, 다중 시점 융합 방법을 모두 능가함을 입증하였다.