11일 전

오픈세트 반감독 학습을 위한 다중 작업 커리큘럼 프레임워크

Qing Yu, Daiki Ikami, Go Irie, Kiyoharu Aizawa
오픈세트 반감독 학습을 위한 다중 작업 커리큘럼 프레임워크
초록

반감독 학습(Semi-supervised learning, SSL)은 라벨이 부여된 데이터가 제한적일 때, 라벨이 없는 데이터를 활용하여 강력한 모델을 훈련시키기 위해 제안된 기법이다. 기존의 SSL 방법들은 라벨이 부여된 데이터와 라벨이 없는 데이터 내 샘플들이 동일한 클래스에 속한다고 가정하지만, 본 연구에서는 라벨이 없는 데이터에 분포 외(out-of-distribution, OOD) 샘플이 포함된 더 복잡한 새로운 시나리오인 오픈셋 반감독 학습(open-set SSL)을 다룬다. OOD 탐지기와 SSL을 별도로 학습하는 기존 접근 방식이 아닌, 다중 과제 커리큘럼 학습 프레임워크를 제안한다. 먼저, 라벨이 없는 데이터 내 OOD 샘플을 탐지하기 위해 샘플이 OOD에 속할 확률을 추정한다. 이를 위해 네트워크 파라미터와 OOD 점수를 교대적으로 업데이트하는 공동 최적화 프레임워크를 사용한다. 동시에, 분포 내(in-distribution, ID) 데이터의 분류 성능을 극대화하기 위해 OOD 점수가 낮은 ID 샘플을 라벨이 없는 데이터에서 선별하고, 이 데이터를 라벨이 있는 데이터와 함께 사용하여 딥 신경망을 반감독 방식으로 훈련시켜 ID 샘플을 분류한다. 다양한 실험을 수행한 결과, 본 방법은 OOD 샘플의 영향을 성공적으로 제거함으로써 최신 기술(SOTA) 수준의 성능을 달성하였다.

오픈세트 반감독 학습을 위한 다중 작업 커리큘럼 프레임워크 | 최신 연구 논문 | HyperAI초신경