2달 전

다중 작업 약한 감독을 이용한 복잡 모델 훈련

Alexander Ratner; Braden Hancock; Jared Dunnmon; Frederic Sala; Shreyash Pandey; Christopher Ré
다중 작업 약한 감독을 이용한 복잡 모델 훈련
초록

기계 학습 모델이 점점 더 복잡해짐에 따라, 대규모 수작업 라벨링 훈련 세트를 수집하는 것이 실제 적용에서 가장 큰 장애물 중 하나가 되었습니다. 이에 대신, 비용은 저렴하지만 노이즈가 많은 라벨을 제공하는 약한 감독 형태가 자주 사용됩니다. 그러나 이러한 약한 감독 소스들은 다양한 정확도를 가지고 있으며, 서로 연관된 라벨을 출력하거나, 다른 작업을 라벨링하거나 또는 다른 세분화 수준에서 적용될 수 있습니다. 우리는 이러한 문제의 관련 하위 작업을 다르게 라벨링하는 것으로 보아 약한 감독 소스들을 통합하고 모델링하는 프레임워크를 제안합니다. 이를 다중 작업 약한 감독 환경(multi-task weak supervision setting)이라고 지칭합니다. 우리는 행렬 완성(matrix completion) 스타일의 문제를 해결함으로써, 어떤 라벨링 데이터도 없이 이러한 다중 작업 소스들의 정확도와 그들 간의 의존 구조를 복원할 수 있음을 보여줍니다. 이는 최종 모델을 훈련시키기 위한 더 우수한 감독을 제공하게 됩니다.이론적으로, 우리는 이 접근법으로 훈련된 모델들의 일반화 오류가 비라벨 데이터 포인트의 수가 증가함에 따라 개선됨을 보여주며, 작업과 의존 구조에 대한 스케일링 특성을 분석하였습니다. 세 가지 세밀한 분류 문제(fine-grained classification problems)에서 우리의 접근법이 전통적인 지도 학습 방법보다 평균 20.2%의 정확도 향상을 가져왔으며, 다수결 기준(majority vote baseline)보다 6.8%, 그리고 각각의 작업을 별도로 모델링하는 기존의 약한 감독 방법보다 4.1%의 정확도 향상을 가져왔음을 보여주었습니다.

다중 작업 약한 감독을 이용한 복잡 모델 훈련 | 최신 연구 논문 | HyperAI초신경