2달 전

CPGNet: 실시간 LiDAR 의미 분할을 위한 캐스케이드 포인트-그리드 융합 네트워크

Xiaoyan Li; Gang Zhang; Hongyu Pan; Zhenhua Wang
CPGNet: 실시간 LiDAR 의미 분할을 위한 캐스케이드 포인트-그리드 융합 네트워크
초록

고급 자율 주행에 필수적인 LiDAR 의미 분할은 모바일 플랫폼에서 정확하고 빠르게 배포될 수 있어야 합니다. 이전의 포인트 기반 또는 희소 복셀 기반 방법들은 시간이 소요되는 이웃 검색이나 희소 3D 합성곱을 사용하기 때문에 실시간 응용 프로그램과는 거리가 멉니다. 최근의 2D 투영 기반 방법들, 범위 뷰(range view)와 다중 뷰 융합(multi-view fusion)을 포함하여, 실시간으로 실행할 수 있지만 2D 투영 과정에서 정보 손실로 인해 정확도가 낮아집니다. 또한 성능을 개선하기 위해 이전 방법들은 일반적으로 테스트 시간 증강(test time augmentation, TTA)를 채택하지만, 이는 추론 과정을 더욱 느리게 만듭니다. 이러한 문제를 해결하기 위해 우리는 효과성과 효율성을 모두 보장하는 두 가지 주요 기술을 통해 더 나은 속도-정확도 균형을 달성하기 위한 캐스케이드 포인트-그리드 융합 네트워크(Cascade Point-Grid Fusion Network, CPGNet)를 제안합니다.1) 혁신적인 포인트-그리드(PG) 융합 블록은 효율성을 위해 주로 2D 투영 그리드에서 의미 특징을 추출하면서, 최소한의 정보 손실로 2D와 3D 특징을 3D 포인트에서 요약합니다.2) 제안된 변환 일관성 손실(transform consistency loss)은 단일 시간 모델 추론과 TTA 사이의 간극을 좁힙니다.SemanticKITTI 및 nuScenes 벤치마크에서 수행된 실험 결과, 앙상블 모델이나 TTA 없이 CPGNet이 최신 RPVNet과 유사한 성능을 보임을 확인할 수 있었으며, 실행 속도는 4.7배 더 빠릅니다.

CPGNet: 실시간 LiDAR 의미 분할을 위한 캐스케이드 포인트-그리드 융합 네트워크 | 최신 연구 논문 | HyperAI초신경