2달 전
소수 샷 텍스트 분류를 위한 인덕션 네트워크
Ruiying Geng; Binhua Li; Yongbin Li; Xiaodan Zhu; Ping Jian; Jian Sun

초록
데이터가 부족하거나 새로운 클래스에 적응해야 하는 경우 텍스트 분류는 어려움을 겪곤 합니다. 이러한 도전적인 시나리오에서 최근 연구들은 샘플 단위 수준에서 새로운 쿼리를 작은 지원 집합과 비교하는 소수 샘플 학습(few-shot task)을 시뮬레이트하기 위해 메타러닝(meta-learning)을 활용하였습니다. 그러나, 같은 클래스 내의 다양한 표현이 이 샘플 단위 비교를 심각하게 방해할 수 있습니다. 따라서, 우리는 지원 집합의 각 클래스에 대한 일반적인 표현을 학습하고 이를 새로운 쿼리와 비교할 수 있어야 합니다. 본 논문에서는 메타러닝에서 동적 라우팅 알고리즘(dynamic routing algorithm)을 혁신적으로 활용하여 이러한 일반화된 클래스별 표현(class-wise representation)을 학습하는 새로운 유도 네트워크(Induction Network)를 제안합니다. 이렇게 하여 모델이 더 나은 유도와 일반화를 수행할 수 있음을 확인하였습니다. 제안된 모델은 잘 연구된 감성 분류 데이터셋(영어)과 실제 대화 의도 분류 데이터셋(중국어)에서 평가되었습니다. 실험 결과, 두 데이터셋 모두에서 제안된 모델이 기존 최신 접근법들보다 상당히 우수한 성능을 보였으며, 소수 샘플 텍스트 분류에서 클래스별 일반화의 효과성을 입증하였습니다.