19일 전
공개 데이터셋만을 사용한 강력하고 재현 가능한 객체 탐지기
Tianhe Ren, Jianwei Yang, Shilong Liu, Ailing Zeng, Feng Li, Hao Zhang, Hongyang Li, Zhaoyang Zeng, Lei Zhang

초록
이 연구는 COCO val2017에서 64.6 AP, COCO test-dev에서 64.8 AP를 달성하며, 테스트 시 증강 기법 없이도 7억 개의 파라미터(700M parameters)만을 사용하는 강력하고 재현 가능한 객체 탐지 모델인 Focal-Stable-DINO을 제안한다. 본 모델은 강력한 FocalNet-Huge 백본과 효과적인 Stable-DINO 탐지기의 조합을 탐구한다. 기존의 최고 성능(SOTA) 모델들이 대규모 사적 데이터 또는 통합 데이터를 활용하고 복잡한 학습 기법 및 방대한 수의 파라미터를 사용하는 반면, 본 모델은 공개된 Objects365 데이터셋에만 의존하여 학습되며, 이는 제안된 접근법의 재현 가능성을 보장한다.