2달 전

타겟 언어의 라벨되지 않은 데이터를 활용한 단일/다중 출처 크로스-링갈 NER를 위한 교사-학생 학습

Qianhui Wu; Zijia Lin; Börje F. Karlsson; Jian-Guang Lou; Biqing Huang
타겟 언어의 라벨되지 않은 데이터를 활용한 단일/다중 출처 크로스-링갈 NER를 위한 교사-학생 학습
초록

라벨이 부족하거나 전혀 없는 언어에서 명명된 실체 인식(NER) 문제를 더 효과적으로 해결하기 위해서는 다국어간 NER가 라벨 데이터가 풍부한 소스 언어에서 학습된 지식을 효과적으로 활용해야 합니다. 이전의 다국어간 NER 연구들은 대부분 쌍으로 구성된 텍스트의 라벨 투사 또는 직접 모델 전송에 기반하고 있습니다. 그러나 이러한 방법들은 소스 언어의 라벨 데이터가 사용할 수 없을 때 적용되지 않거나, 대상 언어의 비라벨 데이터에 포함된 정보를 활용하지 못하는 경우가 많습니다. 본 논문에서는 이러한 제한 사항을 해결하기 위해 교사-학생 학습 방법을 제안합니다. 여기서 소스 언어의 NER 모델들이 교사 역할을 하여 대상 언어의 비라벨 데이터로 학생 모델을 훈련시킵니다. 제안된 방법은 단일 소스와 다중 소스 다국어간 NER 모두에 적용됩니다. 후자의 경우, 우리는 서로 다른 교사 모델들로부터 얻은 감독 정보를 더 잘 가중하기 위한 유사도 측정 방법도 제안합니다. 3개의 대상 언어에 대한 벤치마크 데이터셋에서 수행한 광범위한 실험 결과는, 우리의 방법이 단일 소스와 다중 소스 다국어간 NER 모두에서 기존 최신 방법들을 능가함을 잘 입증하였습니다.

타겟 언어의 라벨되지 않은 데이터를 활용한 단일/다중 출처 크로스-링갈 NER를 위한 교사-학생 학습 | 최신 연구 논문 | HyperAI초신경