3달 전
3D 인스턴스 세그멘테이션을 위한 쿼리 리파인먼트 트랜스포머
{Tianzhu Zhang, Jianfeng He, Chuxin Wang, Jiacheng Deng, Jiahao Lu}

초록
3D 인스턴스 세그멘테이션은 장면 내 객체 인스턴스의 집합을 예측하고, 해당 객체에 대한 이진 전경 마스크와 의미적 레이블을 제공하는 것을 목표로 한다. 그러나 객체 인스턴스는 형태와 카테고리 측면에서 다양성이 크며, 포인트 클라우드는 일반적으로 희박하고 순서가 없으며 불규칙한 구조를 지니고 있어, 쿼리 샘플링의 딜레마를 초래한다. 게다가 노이즈가 포함된 배경 쿼리들은 정확한 장면 인식과 정밀한 인스턴스 세그멘테이션을 방해한다. 위의 문제를 해결하기 위해 우리는 QueryFormer이라 명명한 쿼리 개선 트랜스포머를 제안한다. 본 연구의 핵심은 높은 커버리지와 낮은 반복률을 갖는 쿼리 분포의 초기화 과정을 최적화하기 위해 쿼리 초기화 모듈을 활용하는 것이다. 또한, 노이즈 배경 쿼리의 간섭을 억제하고 전경 쿼리가 인스턴스의 구분 가능한 부분에 집중할 수 있도록 돕는 보조 트랜스포머 디코더를 설계하였다. ScanNetV2 및 S3DIS 데이터셋에서 실시한 광범위한 실험 결과, QueryFormer이 기존 최고 수준의 3D 인스턴스 세그멘테이션 방법들을 능가함을 확인할 수 있었다.