17일 전

이미지 번역을 활용한 앙상블 자기지도 학습을 통한 비지도 도메인 적응

Fabrizio J. Piva, Gijs Dubbelman
이미지 번역을 활용한 앙상블 자기지도 학습을 통한 비지도 도메인 적응
초록

우리는 다중 이미지 번역, 앙상블 학습, 그리고 자기지도 학습을 하나의 통합된 접근 방식으로 결합한 비지도 도메인 적응(UDA) 전략을 제안한다. 본 연구는 라벨이 부여된 합성 데이터와 라벨이 없는 실세계 데이터를 함께 사용하여 세분화 모델을 훈련시키는 전형적인 UDA 과제에 초점을 맞춘다. 이 과제의 목적은 실세계 데이터에 대해 뛰어난 성능을 발휘하는 것이다. 다중 이미지 번역의 장점을 극대화하기 위해, 서로 다른 이미지 번역에 대한 특징을 입력으로 받아 각 분류기가 독립적으로 예측을 수행하는 앙상블 학습 방식을 제안한다. 이후 이러한 분류기들의 출력은 희소 다항 로지스틱 회귀(Sparse Multinomial Logistic Regression)를 통해 결합되며, 이 회귀층은 메타-러너(Meta-learner)로 알려져 있다. 메타-러너는 자기지도 학습 과정에서 의사 라벨( pseudo-label) 생성 시 발생할 수 있는 편향을 줄이고, 각 분류기의 기여도를 고려함으로써 모델의 일반화 성능을 향상시킨다. 제안한 방법은 GTA V 및 Synthia를 Cityscapes로 적응시키는 표준 UDA 벤치마크에서 평가되었으며, 평균 교차율(mIoU) 지표에서 최신 기준(SOTA) 성능을 달성하였다. 또한 제안 전략의 우수한 특성을 입증하기 위해 광범위한 아블레이션 실험 결과를 제시한다.

이미지 번역을 활용한 앙상블 자기지도 학습을 통한 비지도 도메인 적응 | 최신 연구 논문 | HyperAI초신경