17일 전

ScaleDet: 확장 가능한 다중 데이터셋 객체 탐지기

Yanbei Chen, Manchen Wang, Abhay Mittal, Zhenlin Xu, Paolo Favaro, Joseph Tighe, Davide Modolo
ScaleDet: 확장 가능한 다중 데이터셋 객체 탐지기
초록

다중 데이터셋 학습은 추가적인 레이블링 비용 없이 이질적인 대규모 데이터셋을 효과적으로 활용할 수 있는 실용적인 해결책을 제공한다. 본 연구에서는 학습 데이터셋의 수를 늘릴수록 데이터셋 간 일반화 성능이 확장되는 확장 가능한 다중 데이터셋 탐지기(ScaleDet)를 제안한다. 기존의 다중 데이터셋 학습 방법들이 주로 수작업을 통한 레이블 재표기 또는 복잡한 최적화 기법에 의존하여 데이터셋 간 레이블을 통일하는 데 의존하는 것과 달리, 우리는 다중 데이터셋 학습을 위한 통합된 의미적 레이블 공간을 도출하기 위해 간단하면서도 확장 가능한 수식을 제안한다. ScaleDet는 시각-텍스트 정렬을 통해 데이터셋 간 레이블의 의미적 유사성을 기반으로 레이블 할당을 학습한다. 학습이 완료된 후, ScaleDet는 사전에 관측된 클래스와 관측되지 않은 클래스를 포함한 어떤 상류 및 하류 데이터셋에서도 우수한 일반화 성능을 발휘할 수 있다. 본 연구에서는 상류 데이터셋으로 LVIS, COCO, Objects365, OpenImages를, 하류 데이터셋으로 '야생에서의 객체 탐지(ODinW)'에서 추출한 13개 데이터셋을 활용하여 광범위한 실험을 수행하였다. 실험 결과 ScaleDet는 동일한 백본을 사용하는 최신 기술 대비 뛰어난 성능을 보였으며, LVIS에서 mAP 50.7, COCO에서 58.8, Objects365에서 46.8, OpenImages에서 76.2, ODinW에서 71.8의 성능을 달성하였다.