8일 전
센트리: 무 supervision 도메인 적응을 위한 위원회 일관성에 의한 선택적 엔트로피 최적화
Viraj Prabhu, Shivam Khare, Deeksha Kartik, Judy Hoffman

초록
기존의 비지도 도메인 적응(UDA) 접근법은 주로 데이터 분포 변화에만 초점을 맞추며, 추가적인 도메인 간 레이블 분포 변화 상황에서는 제한된 성과를 보이고 있다. 최근 타겟 데이터에 대한 자기 훈련(self-training)을 활용한 방법이 주목받고 있으나, 도전적인 분포 변화 상황에서는 타겟의 가짜 레이블(pseudo-label)이 매우 신뢰할 수 없을 수 있으며, 이를 자기 훈련에 사용할 경우 오류 누적이 발생하고 도메인 불일치 문제가 악화될 수 있다. 본 연구에서는 '위원회 일관성 기반의 선택적 엔트로피 최적화(SENTRY)'라는 새로운 UDA 알고리즘을 제안한다. 이 알고리즘은 임의의 이미지 변환 집합(위원회)에 대해 타겟 인스턴스의 예측 일관성 수준을 기반으로 그 신뢰도를 평가한다. 이후 예측 일관성이 높은 타겟 인스턴스에 대해서는 예측 엔트로피를 선택적으로 최소화하여 신뢰도를 높이고, 반대로 일관성이 낮은 인스턴스에 대해서는 예측 엔트로피를 최대화하여 신뢰도를 낮춘다. 가짜 레이블 기반의 타겟 클래스 균형 조정과 결합함으로써, 본 방법은 표준 UDA 벤치마크에서 31개의 도메인 전이 중 27개와 레이블 분포 변화 하에서 적응 성능을 시험하는 특수 벤치마크에서 최신 기술 대비 의미 있는 성능 향상을 달성하였다.