8일 전

d-SNE: 확률적 이웃 임베딩을 활용한 도메인 적응

{ Orchid Majumder, Gurumurthy Swaminathan, Ragav Venkatesan, Xiong Zhou, Xiang Xu}
d-SNE: 확률적 이웃 임베딩을 활용한 도메인 적응
초록

한편, 심층 신경망은 대규모 데이터셋을 효과적으로 학습하는 데 유용하다. 그러나 데이터 사용 측면에서는 효율성이 떨어진다. 이러한 네트워크는 수많은 파라미터를 학습하기 위해 풍부한 레이블 데이터를 요구하는 경우가 많다. 특히 소규모 데이터셋을 사용할 경우, 적절한 정규화 없이 더 크고 깊은 네트워크를 학습하는 것은 어렵다. 또한, 잘 레이블링된 데이터를 수집하는 것은 비용이 많이 들고 시간이 오래 걸리며, 때로는 현실적으로 불가능하다. 이러한 문제를 완화하기 위해 널리 사용되는 방법 중 하나는 대체적인 대표 데이터셋에서 더 많은 데이터를 활용해 네트워크를 학습하는 것이다. 그러나 만약 대표 데이터셋의 통계적 특성이 타겟 데이터셋과 크게 다를 경우, 이는 부정적인 영향을 초래할 수 있다. 이러한 문제는 도메인 전이(domain shift) 현상에 기인한다. 대표 도메인에서 학습된 특징 추출기(feature extractor)를 사용할 때, 전이된 도메인의 데이터는 특화된 특징을 생성하지 못할 수 있다. 과거에는 이러한 도메인 전이 문제를 해결하기 위해 여러 도메인 적응(domain adaptation) 기법이 제안된 바 있다. 본 논문에서는 확률적 이웃 임베딩 기법과 새로운 수정형 하우스도르프 거리(modified-Hausdorff distance)를 현명하게 활용하는 새로운 도메인 적응 기법(d-SNE)을 제안한다. 제안된 기법은 엔드 투 엔드(end-to-end)로 학습이 가능하므로 신경망 학습에 매우 적합하다. 광범위한 실험을 통해 d-SNE가 현재 최고 수준의 기법들을 능가하며, 다양한 데이터셋 간의 변동성에도 강건함을 입증하였고, 일회 학습(one-shot learning) 및 반감독 학습(semi-supervised learning) 환경에서도 뛰어난 성능을 보였다. 또한 d-SNE는 동시에 여러 도메인으로의 일반화 능력도 갖추고 있음을 확인하였다.