17일 전

CONTaiNER: 대조 학습을 통한 소량 샘플 명명된 실체 인식

Sarkar Snigdha Sarathi Das, Arzoo Katiyar, Rebecca J. Passonneau, Rui Zhang
CONTaiNER: 대조 학습을 통한 소량 샘플 명명된 실체 인식
초록

소수 샘플 설정에서의 명명된 실체 인식(Named Entity Recognition, NER)은 자원이 제한된 도메인에서 실체 태깅에 있어 필수적이다. 기존의 접근 방식들은 소스 도메인에서 클래스별 특성 및 중간 표현만을 학습한다. 이로 인해 예측할 수 없는 타겟 도메인으로의 일반화 능력이 저하되며, 최적의 성능을 달성하지 못하게 된다. 이러한 문제를 해결하기 위해 우리는 소수 샘플 NER를 위한 새로운 대비 학습 기법(CONTaiNER)을 제안한다. CONTaiNER는 토큰 간 분포 거리 최적화를 통해 소수 샘플 NER의 성능을 향상시킨다. 클래스별 특성 최적화가 아니라, 가우시안 분포를 따르는 임베딩 기반으로 토큰 카테고리 간의 구분을 위한 일반화된 목적 함수를 최적화함으로써, 훈련 도메인에서 발생하는 과적합 문제를 효과적으로 완화한다. 다양한 기존 테스트 도메인(OntoNotes, CoNLL'03, WNUT '17, GUM)과 새로운 대규모 소수 샘플 NER 데이터셋(Few-NERD)에서의 실험 결과, CONTaiNER는 평균적으로 기존 방법보다 절대 F1 점수에서 3~13% 우수한 성능을 보이며, 이전 방법이 의미 있는 성능을 달성하지 못했던 도전적인 상황에서도 일관된 성능 흐름을 보였다.

CONTaiNER: 대조 학습을 통한 소량 샘플 명명된 실체 인식 | 최신 연구 논문 | HyperAI초신경