17일 전

외부 및 내부 지도 정보로부터 학습하는 도메인 일반화

Shujun Wang, Lequan Yu, Caizi Li, Chi-Wing Fu, Pheng-Ann Heng
외부 및 내부 지도 정보로부터 학습하는 도메인 일반화
초록

다양한 도메인 간 신경망의 일반화 능력은 실-world 응용에서 핵심적인 요소이다. 우리는 일반화된 객체 인식 시스템이 동시에 서로 다른 이미지 간의 관계뿐만 아니라 각 이미지 자체의 특징을 잘 이해해야 한다고 주장한다. 이를 달성하기 위해, 다중 소스 도메인에서의 이미지에 대해 외부적 관계 감독과 내재적 자기감독을 동시에 활용하여 도메인 간 일반화를 학습하는 새로운 도메인 일반화 프레임워크를 제안한다. 구체적으로, 다중 작업 학습(Multi-task Learning) 프레임워크를 활용하여 특징 임베딩을 구성한다. 기존의 일반적인 감독 인식 작업 외에도, 모멘텀 거리 학습(task)과 자기감독 보조 작업을 원활하게 통합함으로써 외부 감독과 내재적 감독을 종합적으로 활용한다. 또한, K-hard 음성 샘플 채택 기법을 적용한 효과적인 모멘텀 거리 학습 방식을 개발하여, 네트워크가 도메인 일반화를 위해 이미지 간 관계를 더 잘 포착하도록 촉진한다. 제안한 방법은 VLCS와 PACS라는 두 가지 표준 객체 인식 벤치마크에서 검증되었으며, 기존의 최고 성능 기법들을 초월하는 우수한 성능을 달성함을 보여준다.