11일 전
Omni-DETR: Transformer를 활용한 옴니-슈퍼바이즈드 객체 탐지
Pei Wang, Zhaowei Cai, Hao Yang, Gurumurthy Swaminathan, Nuno Vasconcelos, Bernt Schiele, Stefano Soatto

초록
오미-감독(omni-supervised) 객체 탐지 문제를 고려한다. 이는 객체 탐지에 있어 레이블이 없는 데이터, 완전히 레이블링된 데이터, 그리고 약한 레이블(예: 이미지 태그, 개수, 점 등)을 모두 활용할 수 있도록 하는 문제이다. 이는 최근 학습자-교사(student-teacher) 프레임워크 및 엔드투엔드(transformer 기반) 객체 탐지 기술의 발전을 기반으로 한 통합 아키텍처인 Omni-DETR에 의해 가능해졌다. 이 통합 아키텍처 하에서, 다양한 유형의 약한 레이블은 이중 매칭(bipartite matching) 기반의 필터링 메커니즘을 통해 정확한 가짜 레이블(pseudo labels)을 생성할 수 있으며, 모델은 이를 통해 학습할 수 있다. 실험 결과, Omni-DETR는 여러 데이터셋과 설정에서 최신 기준(SOTA, state-of-the-art) 성능을 달성하였다. 또한 약한 레이블이 탐지 성능 향상에 기여함을 확인하였으며, 완전한 레이블링에 비해 레이블링 비용과 정확도 사이의 균형을 더 우수하게 달성할 수 있음을 발견하였다. 이러한 결과는 다양한 레이블 유형을 혼합한 더 큰 규모의 객체 탐지 데이터셋 구축을 촉진할 수 있을 것으로 기대된다. 코드는 https://github.com/amazon-research/omni-detr 에서 공개되어 있다.