7일 전
SOLQ: 쿼리 학습을 통한 객체 세그멘테이션
Bin Dong, Fangao Zeng, Tiancai Wang, Xiangyu Zhang, Yichen Wei

초록
본 논문에서는 인스턴스 세그멘테이션을 위한 엔드투엔드 프레임워크를 제안한다. 최근에 소개된 DETR [1]을 기반으로 하여, 통합 쿼리(queries)를 학습함으로써 객체를 세그멘테이션하는 본 방법은 SOLQ라 명명된다. SOLQ에서는 각 쿼리가 하나의 객체를 나타내며, 클래스(class), 위치(location), 마스크(mask)라는 여러 표현 방식을 갖는다. 학습된 객체 쿼리는 통합된 벡터 형태로 동시에 분류(classification), 박스 회귀(box regression), 마스크 인코딩(mask encoding)을 수행한다. 학습 단계에서는 인코딩된 마스크 벡터가 원시 공간 마스크의 압축 인코딩(compression coding)에 의해 지도된다. 추론 시에는 압축 인코딩의 역과정을 통해 생성된 마스크 벡터를 직접 공간 마스크로 변환할 수 있다. 실험 결과, SOLQ는 기존 대부분의 접근 방식을 능가하는 최첨단 성능을 달성함을 확인할 수 있었다. 더불어, 통합 쿼리 표현의 공동 학습은 DETR의 탐지 성능을 크게 향상시킨다. 본 연구에서 제안하는 SOLQ가 트랜스포머 기반 인스턴스 세그멘테이션에 있어 강력한 베이스라인으로 활용되기를 기대한다. 코드는 https://github.com/megvii-research/SOLQ 에서 제공된다.