
초록
대규모 3차원 환경의 효율적인 의미 분할을 위한 새로운 슈퍼포인트 기반 트랜스포머 아키텍처를 제안한다. 본 연구는 포인트 클라우드를 계층적인 슈퍼포인트 구조로 분할하는 빠른 알고리즘을 도입하여 전처리 속도를 기존 슈퍼포인트 기반 접근 방식보다 7배 빠르게 한다. 또한 다중 스케일에서 슈퍼포인트 간의 관계를 포착하기 위해 자체 주의(self-attention) 메커니즘을 활용함으로써, S3DIS(76.0% mIoU, 6-fold 검증), KITTI-360(Val에서 63.5%), DALES(79.6%) 세 가지 도전적인 벤치마크 데이터셋에서 최신 기술 수준의 성능을 달성한다. 파라미터 수가 단 212,000개에 불과하여, 다른 최신 모델보다 최대 200배 더 작으면서도 유사한 성능을 유지한다. 더불어, S3DIS 데이터셋의 한 폴드에 대한 학습을 단일 GPU에서 3시간 내에 완료할 수 있으며, 가장 우수한 성능을 기록한 기존 방법들보다 GPU 시간 기준 7배에서 70배까지 절약된다. 본 연구의 코드 및 모델은 github.com/drprojects/superpoint_transformer에서 공개되어 있다.