11일 전

UniDet3D: 다중 데이터셋 기반 실내 3D 객체 탐지

Maksim Kolodiazhnyi, Anna Vorontsova, Matvey Skripkin, Danila Rukhovich, Anton Konushin
UniDet3D: 다중 데이터셋 기반 실내 3D 객체 탐지
초록

로봇 공학 및 증강현실 분야에서 스마트 솔루션에 대한 고객 수요가 증가함에 따라 포인트 클라우드에서의 3D 객체 탐지에 대한 관심이 크게 증가하고 있다. 그러나 기존의 개별 실내 데이터셋은 크기가 작고 다양성이 부족하여 강력하고 일반화된 3D 객체 탐지 모델을 훈련하기에는 부적합하다. 한편, 기초 모델(foundation models)을 활용하는 더 일반적인 접근 방식은 특정 작업에 대해 감독 학습된 방법에 비해 여전히 성능이 낮은 편이다. 본 연구에서는 실내 데이터셋의 혼합 데이터를 기반으로 훈련되며 다양한 실내 환경에서 활용 가능한 간단하면서도 효과적인 3D 객체 탐지 모델을 제안한다. 서로 다른 레이블 공간을 통일함으로써, 감독 기반의 공동 훈련 방식을 통해 여러 데이터셋 간에 강력한 표현 능력을 학습할 수 있도록 한다. 제안하는 네트워크 아키텍처는 기본적인 트랜스포머 인코더를 기반으로 구성되어 있어 실용적인 활용을 위해 예측 파이프라인을 쉽게 실행하고, 커스터마이징하며 확장할 수 있다. 광범위한 실험을 통해 제안한 모델은 6개의 실내 벤치마크(ScanNet, ARKitScenes, S3DIS, MultiScan, 3RScan, ScanNet++)에서 기존 3D 객체 탐지 기법 대비 유의미한 성능 향상을 보였다. 각각의 성능 향상은 ScanNet(+1.1 mAP50), ARKitScenes(+19.4 mAP25), S3DIS(+9.1 mAP50), MultiScan(+9.3 mAP50), 3RScan(+3.2 mAP50), ScanNet++(+2.7 mAP50)이다. 코드는 https://github.com/filapro/unidet3d 에서 공개되어 있다.

UniDet3D: 다중 데이터셋 기반 실내 3D 객체 탐지 | 최신 연구 논문 | HyperAI초신경