11일 전
TORNADO-Net: 다중 시점 총 변동성 의미 분할을 위한 다이아몬드 인셉션 모듈 포함
Martin Gerdzhev, Ryan Razani, Ehsan Taghavi, Bingbing Liu

초록
점군의 의미 분할은 로봇 및 자율 주행 분야에서 장면 이해의 핵심 요소이다. 본 논문에서는 3D LiDAR 점군 의미 분할을 위한 신경망인 TORNADO-Net을 제안한다. 우리는 다중 시점(버드아이 및 레인지) 투영 기반의 특징 추출을 인코더-디코더 구조를 갖춘 ResNet 아키텍처와 새로운 다이아몬드 컨텍스트 블록과 결합하였다. 기존의 투영 기반 방법은 이웃한 점들이 일반적으로 동일한 클래스에 속한다는 사실을 고려하지 않는다. 이러한 국소적 이웃 정보를 보다 효과적으로 활용하고 노이즈가 많은 예측을 줄이기 위해, 전반적 변동성(Total Variation), Lovasz-Softmax, 가중 크로스 엔트로피 손실 함수의 조합을 도입한다. 또한 LiDAR 데이터가 360도의 시야각을 갖추고 있으며, 원형 패딩(circular padding)을 사용할 수 있다는 점을 활용하였다. 제안하는 방법은 SemanticKITTI 데이터셋에서 최신 기준(SOTA) 성능을 달성하였으며, 철저한 정량적 평가 및 아블레이션 실험 결과도 제공한다.