11일 전

비지도 도메인 적응을 위한 희석된 구분형 클러스터링

Hui Tang, Yaowei Wang, Kui Jia
비지도 도메인 적응을 위한 희석된 구분형 클러스터링
초록

비지도 도메인 적응은 동일한 레이블 공간을 공유하지만 분포가 다른 레이블링된 소스 도메인 데이터를 바탕으로 레이블이 없는 타겟 도메인 데이터를 분류하는 문제를 다룹니다. 최근의 대부분의 방법들은 두 도메인 간의 특징 분포를 명시적으로 정렬하는 접근을 취하고 있습니다. 반면, 도메인 적응의 근본적인 가정에 착안하여, 우리는 레이블이 주어진 소스 도메인 데이터가 타겟 도메인과 밀접하게 관련되어 있다는 강력한 사전 정보를 활용하여, 타겟 데이터에 대한 구분 가능한 군집화 문제로 도메인 적응 문제를 재정의합니다. 기술적으로, 타겟 데이터를 적응적으로 필터링하는 강건한 엔트로피 최소화의 변형을 기반으로 한 군집화 목적함수, 소프트 파이셔 유사 기준, 그리고 중심점 분류를 통한 군집 순서화를 활용합니다. 타겟 군집화를 위한 구분 가능한 소스 정보를 정제하기 위해, 레이블이 주어진 소스 데이터에 대해 병렬적으로 지도 학습 목적함수를 함께 최적화하는 네트워크 학습 전략을 제안합니다. 본 방법을 도메인 적응을 위한 정제된 구분 가능한 군집화라고 명명하며, DisClusterDA라고 합니다. 또한 DisClusterDA의 구성 목적함수들이 클래스별로 순수하고 밀집된 특징 분포를 학습하는 데 어떻게 기여하는지 설명하는 기하학적 직관을 제시합니다. 다양한 기준 데이터셋(다수의 소스 도메인 적응을 포함한 다섯 개의 대표적 벤치마크 데이터셋)에서 철저한 아블레이션 연구 및 광범위한 실험을 수행하였으며, 일반적으로 사용되는 백본 네트워크 기반으로 DisClusterDA는 기존 방법들을 모두 능가하는 성능을 보였습니다. 특히 흥미로운 점은, 본 DisClusterDA 프레임워크 내에서 도메인 간 클래스 수준의 특징 분포를 명시적으로 정렬하도록 하는 추가적인 손실 항을 도입할 경우 오히려 적응 성능이 저하된다는 점입니다. 다만, 이 현상은 다른 알고리즘 프레임워크에서 보다 세심한 연구가 필요함을 시사합니다.

비지도 도메인 적응을 위한 희석된 구분형 클러스터링 | 최신 연구 논문 | HyperAI초신경