8일 전

모호한 레이블 학습: 다양한 모호한 레이블 구성에 대한 통합적 프레임워크

Hao Chen, Ankit Shah, Jindong Wang, Ran Tao, Yidong Wang, Xing Xie, Masashi Sugiyama, Rita Singh, Bhiksha Raj
모호한 레이블 학습: 다양한 모호한 레이블 구성에 대한 통합적 프레임워크
초록

정확한 레이블이 부족한 상황, 예를 들어 노이즈 있는 레이블, 부분적 레이블, 다수의 레이블 후보 등과 같은 다양한 불확실한 레이블(이를 종합적으로 \textit{불확실한 레이블}이라 칭함)을 가진 학습은 머신러닝 작업에서 흔히 발생하는 도전 과제이다. 기존의 방법들은 각각의 새로운 불확실한 레이블 구조에 대해 특별히 설계된 접근법을 제안하는 경향이 있었으며, 이러한 다양한 불확실성 구조가 동시에 존재할 경우 이러한 접근은 일반적으로 지속 가능성이 낮다. 본 논문에서는 다양한 불확실한 레이블 구조에 대한 통합적 학습을 가능하게 하는 '불확실한 레이블 학습(Imperfect Label Learning, ILL)' 프레임워크를 제안한다. ILL은 기대최대화(Expectation-Maximization, EM) 기법을 활용하여 불확실한 레이블 정보를 모델링하며, 정확한 레이블을 잠재 변수로 간주한다. 학습 과정에서 정확한 레이블을 근사하는 대신, 불확실한 정보에 의해 암시되는 모든 가능한 레이블 분포 전체를 고려한다. 우리는 ILL이 부분적 레이블 학습, 반감독 학습, 노이즈 레이블 학습은 물론, 더 중요한 점에서 이러한 설정들의 혼합 환경에도 원활하게 적응할 수 있음을 입증한다. 특히, 기존의 특정 상황에 특화된 불확실한 레이블 처리 기법들을 모두 능가하며, 다양한 어려운 환경에서 강력하고 효과적인 성능을 보이는 최초의 통합적 프레임워크로서의 의의를 지닌다. 본 연구가 이 분야에 대한 추가적인 연구를 촉진하고, 정확한 레이블 확보가 비용이 많이 들거나 복잡한 다양한 시나리오에서 ILL의 잠재력을 극대화하는 데 기여하기를 기대한다.