17일 전

라벨 노이즈 하에서 LLM의 모델 강건성 향상을 위한 대조 학습

Aritra Ghosh, Andrew Lan
라벨 노이즈 하에서 LLM의 모델 강건성 향상을 위한 대조 학습
초록

카테고리형 교차 엔트로피(CCE) 손실 함수로 훈련된 딥 신경망 기반 분류기는 훈련 데이터 내 레이블 노이즈에 취약하다. 레이블 노이즈의 영향을 완화할 수 있는 일반적인 방법 중 하나는 감독 기반의 강건한 방법으로, 단순히 CCE 손실 함수를 레이블 노이즈에 강건한 손실 함수로 대체하거나, 손실 값이 높은 샘플의 가중치를 낮추는 방식으로 훈련 샘플을 재가중하는 것이다. 최근에는 반감독 학습(Semi-Supervised Learning, SSL)을 활용하는 또 다른 유형의 방법이 제안되었으며, 이는 기존의 감독 기반 강건한 방법을 보완하여 (가능성은 있지만) 노이즈가 있는 샘플들을 더 효과적으로 활용할 수 있도록 한다. 비록 감독 기반 강건한 방법은 다양한 데이터 유형에서 우수한 성능을 보여왔지만, 레이블 노이즈 하에서 이미지 분류 작업에서는 SSL 방법에 비해 성능이 열등함이 입증되었다. 따라서 이러한 감독 기반 강건한 방법이 더 효과적으로 미라벨링된 샘플을 활용할 수 있다면, 그 성능이 여전히 뛰어날지 여부는 여전히 미해결 과제로 남아 있다. 본 논문에서는 대조 학습(contrastive learning)을 통해 학습된 표현을 활용해 감독 기반 강건한 방법을 초기화함으로써, 레이블 노이즈 하에서도 성능이 크게 향상됨을 보여준다. 놀랍게도, 가장 간단한 방법(즉, CCE 손실 함수로 분류기를 훈련하는 방법)조차도 대조 학습을 초기화 조건으로 사용할 경우, 고도의 레이블 노이즈 환경에서 최첨단 SSL 방법보다 50% 이상 우수한 성능을 기록할 수 있다. 본 연구의 구현 코드는 공개적으로 제공될 예정이며, 다음 URL에서 확인할 수 있다: {\url{https://github.com/arghosh/noisy_label_pretrain}}.