15일 전

엔드투엔드 약한 감독

Salva Rühling Cachay, Benedikt Boecking, Artur Dubrawski
엔드투엔드 약한 감독
초록

약한 감독(Weak Supervision, WS)의 다수 소스를 통합하는 것은 기계학습 응용 분야에서 흔히 나타나는 데이터 레이블링 한계를 완화할 수 있다. 이는 정확한 레이블을 수동으로 수집하는 번거로운 과정을 대체함으로써 가능하다. 그러나 현재 최첨단 기법 중 일부는 학습용 레이블이 전혀 필요 없는 방식을 채택하고 있으나, 두 단계의 별도 모델링 과정을 필요로 한다. 첫 번째 단계는 약한 감독 소스 기반의 확률적 잠재변수 모델을 학습하는 것으로, 실무 상 거의 성립하지 않는 가정을 내포하고 있다. 두 번째 단계는 이후 모델 학습을 수행하는 것이다. 중요한 점은, 첫 번째 모델링 단계가 이후 모델의 성능을 고려하지 않는다는 것이다. 이러한 문제점을 해결하기 위해, 신경망을 활용해 이전 확률적 사후분포를 재매개변수화하여 생성된 확률적 레이블과의 일치도를 극대화함으로써, 이후 모델을 직접 엔드투엔드(end-to-end) 방식으로 학습하는 새로운 접근법을 제안한다. 실험 결과, 기존 방법 대비 이후 테스트 세트에서의 최종 모델 성능이 향상되었으며, 약한 감독 소스 간의 종속성에 대한 강건성(robustness) 또한 개선됨을 확인할 수 있었다.

엔드투엔드 약한 감독 | 최신 연구 논문 | HyperAI초신경