압축 주의 매칭을 통한 보편적 도메인 적응

범용 도메인 적응(Universal Domain Adaptation, UniDA)은 타겟 도메인의 레이블 집합에 대한 사전 지식 없이도 소스 도메인에서 타겟 도메인으로 지식을 전이하는 것을 목표로 한다. 이 과제의 핵심은 타겟 샘플이 공통 카테고리에 속하는지 여부를 어떻게 판단할 수 있는가에 있다. 기존 주류 방법들은 샘플의 특징을 기반으로 판단하지만, 이러한 접근은 전반적인 정보에 과도하게 치중하면서 이미지 내에서 가장 중요한 국소적 객체 정보를 간과하게 되어 정확도가 제한된다. 이러한 문제를 해결하기 위해, 시각 트랜스포머(Vision Transformer)의 자체 주의 메커니즘(Self-attention mechanism)을 활용하여 중요한 객체 정보를 포착하는 새로운 범용 주의 매칭(UniAM) 프레임워크를 제안한다. 제안된 프레임워크는 주의를 압축적으로 표현함으로써 핵심 정보를 탐색하는 새로운 압축적 주의 매칭(Compressive Attention Matching, CAM) 기법을 도입한다. 더불어 CAM은 잔차 기반 측정(Residual-based measurement)을 도입하여 샘플의 공통성을 판단한다. 이 측정 기법을 활용함으로써 UniAM은 도메인 수준 및 카테고리 수준에서 공통 특징 정렬(Common Feature Alignment, CFA)과 타겟 클래스 분리(Target Class Separation, TCS)를 달성한다. 특히 UniAM은 시각 트랜스포머의 주의 메커니즘을 직접 분류 작업에 활용한 최초의 방법이다. 광범위한 실험을 통해 UniAM이 다양한 벤치마크 데이터셋에서 현재 최고 성능을 기록하는 기법들을 능가함을 확인하였다.