2달 전

도메인 적응형 객체 탐지: 불확실성 인지 분포 정합을 통한 접근

{Hong-Han Shuai, Wei-Lun Tseng, Dang-Khoa Nguyen}
도메인 적응형 객체 탐지: 불확실성 인지 분포 정합을 통한 접근
초록

도메인 적응은 레이블이 부여된 소스 데이터로부터의 지식을 타겟 도메인의 레이블이 거의 없는 데이터로 전이하는 것을 목표로 하며, 최근 몇 년간 많은 주목을 받았고, 다양한 멀티미디어 응용을 촉진해왔다. 최근의 접근법들은 이미지 수준과 인스턴스 수준에서 소스 이미지와 타겟 이미지 간의 분포를 정렬함으로써 소스와 타겟 이미지 간의 분포 차이를 줄이기 위해 적대적 학습을 활용하는 효과성을 보여주었다. 그러나 두 도메인 간에 배경 장면이 다를 수 있고, 서로 다른 객체를 포함할 수 있기 때문에 여전히 도전 과제로 남아 있다. 또한 객체의 복잡한 조합과 다양한 이미지 스타일은 비지도 교차 도메인 분포 정렬을 악화시킨다. 이러한 문제를 해결하기 위해 본 논문에서는 객체 탐지에 대한 비지도 도메인 적응을 위한 엔드 투 엔드 접근법을 제안한다. 구체적으로, 두 가지 주요 구성 요소로 이루어진 다수준 엔트로피 주의 정렬(Multi-level Entropy Attention Alignment, MEAA) 방법을 제안한다. 첫째, 지역 불확실성 주의 정렬(Local Uncertainty Attentional Alignment, LUAA) 모듈은 픽셀 단위의 도메인 분류기의 엔트로피를 통해 각 지역의 불확실성을 정보 이론적으로 측정함으로써 모델이 관심 있는 구조 불변 객체를 더 잘 인지하도록 가속화한다. 둘째, 다수준 불확실성 인지형 컨텍스트 정렬(Multi-level Uncertainty-Aware Context Alignment, MUCA) 모듈은 다수준 도메인 분류기의 엔트로피를 기반으로 관련 객체에 대한 도메인 불변 정보를 풍부하게 한다. 제안된 MEAA는 네 가지 도메인 이동 객체 탐지 시나리오에서 평가되었으며, 실험 결과 세 가지 도전적인 시나리오에서 최신 기술 수준의 성능을 달성하고, 한 벤치마크 데이터셋에서도 경쟁력 있는 성능을 보였다.