
초록
약한 감독(Weak Supervision, WS)의 다수 소스를 통합하는 것은 기계학습 응용 분야에서 흔히 나타나는 데이터 레이블링 한계를 완화할 수 있다. 이는 정확한 레이블을 수동으로 수집하는 번거로운 과정을 대체함으로써 가능하다. 그러나 현재 최첨단 기법 중 일부는 학습용 레이블이 전혀 필요 없는 방식을 채택하고 있으나, 두 단계의 별도 모델링 과정을 필요로 한다. 첫 번째 단계는 약한 감독 소스 기반의 확률적 잠재변수 모델을 학습하는 것으로, 실무 상 거의 성립하지 않는 가정을 내포하고 있다. 두 번째 단계는 이후 모델 학습을 수행하는 것이다. 중요한 점은, 첫 번째 모델링 단계가 이후 모델의 성능을 고려하지 않는다는 것이다. 이러한 문제점을 해결하기 위해, 신경망을 활용해 이전 확률적 사후분포를 재매개변수화하여 생성된 확률적 레이블과의 일치도를 극대화함으로써, 이후 모델을 직접 엔드투엔드(end-to-end) 방식으로 학습하는 새로운 접근법을 제안한다. 실험 결과, 기존 방법 대비 이후 테스트 세트에서의 최종 모델 성능이 향상되었으며, 약한 감독 소스 간의 종속성에 대한 강건성(robustness) 또한 개선됨을 확인할 수 있었다.