어드레스 및 딜리스팅: 도메인 적응형 객체 탐지의 통합 및 개선

객체 탐지기는 훈련 데이터와 다른 데이터에 대해 종종 성능이 저조하다. 최근 도메인 적응형 객체 탐지(DAOD) 기법들이 이 문제를 해결하는 데 강력한 성과를 보여주고 있다. 그러나 우리는 과거 연구 결과의 신뢰성을 의심하게 만드는 체계적인 벤치마킹 문제를 발견했다. 이는 향후 발전을 저해하는 요인으로 작용한다. 첫째, 저력 있는 베이스라인(기준 모델)을 사용하지 않아 성능이 과대평가되는 문제이다. 둘째, 구현 방법의 일관성 부족으로 인해 기법 간의 투명한 비교가 어려운 점이다. 셋째, 오래된 백본(Backbone) 모델과 벤치마크의 다양성 부족으로 인해 일반화 능력이 떨어지는 문제이다. 이러한 문제를 해결하기 위해 다음과 같은 기여를 제안한다: (1) DAOD 기법 간 비교를 가능하게 하고 향후 개발을 지원하는 통합 벤치마킹 및 구현 프레임워크인 Align and Distill(ALDI)를 도입한다. (2) 벤치마킹의 문제점을 해결하는 공정하고 최신 기준의 훈련 및 평가 프로토콜을 제안한다. (3) 다양한 실제 데이터를 기반으로 한 평가가 가능한 새로운 DAOD 벤치마크 데이터셋 CFC-DAOD를 제작한다. (4) 기존 최고 성능을 크게 상회하는 새로운 방법 ALDI++을 제안한다. ALDI++은 Cityscapes에서 Foggy Cityscapes로의 전이 시 +3.5 AP50, Sim10k에서 Cityscapes로의 전이 시 +5.7 AP50의 성능 향상을 기록하며, 이 경우 유일하게 공정한 베이스라인을 능가하는 방법이다. 또한 CFC Kenai에서 Channel으로의 전이 시 +0.6 AP50의 성능 향상을 달성한다. ALDI와 ALDI++은 아키텍처에 독립적이며, 추가적인 하이퍼파라미터 튜닝 없이 YOLO 및 DETR 기반 DAOD에서도 새로운 최고 성능을 기록한다. 본 연구의 프레임워크, 데이터셋, 그리고 최고 성능의 방법은 DAOD 분야에 중요한 재정립을 제공하며, 향후 연구에 견고한 기반을 마련한다. 코드 및 데이터는 아래 링크에서 공개된다: https://github.com/justinkay/aldi 및 https://github.com/visipedia/caltech-fish-counting.