16일 전

LiDAR 세그멘테이션을 위한 레인지 뷰 표현의 재고

Lingdong Kong, Youquan Liu, Runnan Chen, Yuexin Ma, Xinge Zhu, Yikang Li, Yuenan Hou, Yu Qiao, Ziwei Liu
LiDAR 세그멘테이션을 위한 레인지 뷰 표현의 재고
초록

LiDAR 세그멘테이션은 자율 주행 인지에 있어 핵심적인 요소이다. 최근의 추세는 기존의 범위 영상(-range view) 표현 방식보다 더 높은 성능을 보이는 포인트 또는 복셀 기반 방법을 선호하고 있다. 본 연구에서는 강력한 범위 영상 모델을 구축하는 데 있어 몇 가지 핵심 요인을 밝혀냈다. 우리는 '다수에서 일대' 매핑, 의미적 불일치, 형상 왜곡 등이 범위 영상 투영에서 효과적인 학습을 방해할 수 있는 가능성을 관찰하였다. 이를 해결하기 위해, 네트워크 아키텍처, 데이터 증강, 후처리에 걸쳐 새로운 설계를 통합한 전주기 프레임워크인 RangeFormer을 제안한다. 이는 범위 영상에서 LiDAR 포인트 클라우드의 학습 및 처리를 보다 효과적으로 수행할 수 있도록 한다. 또한, 임의의 저해상도 2D 범위 영상에서 학습이 가능하면서도 3D 세그멘테이션 정확도를 여전히 만족스럽게 유지할 수 있는 확장 가능한 범위 영상 기반 학습(Scalable Training from Range view, STR) 전략을 도입하였다. 본 연구에서는 처음으로 범위 영상 기반 방법이 SemanticKITTI, nuScenes, ScribbleKITTI 등의 주요 LiDAR 세그멘테이션 및 팔레오판오틱 세그멘테이션 벤치마크에서 포인트 기반, 복셀 기반, 다중 시점 융합 방법을 모두 능가함을 입증하였다.

LiDAR 세그멘테이션을 위한 레인지 뷰 표현의 재고 | 최신 연구 논문 | HyperAI초신경