2달 전
GlossBERT: 의미 분석을 위한 용언 설명 지식을 활용한 BERT
Luyao Huang; Chi Sun; Xipeng Qiu; Xuanjing Huang

초록
단어 의미 구별(Word Sense Disambiguation, WSD)은 특정 맥락에서 모호한 단어의 정확한 의미를 찾는 것을 목표로 합니다. 전통적인 감독 학습 방법은 지식 기반 방법에서 널리 사용되는 WordNet과 같은 어휘 자원을 거의 고려하지 않습니다. 최근 연구에서는 WSD에 용언(의미 정의)을 신경망에 통합하는 것이 효과적임을 보여주었습니다. 그러나 전통적인 단어 전문가 감독 학습 방법과 비교할 때, 이들 방법은 큰 개선을 이루지 못했습니다. 본 논문에서는 감독된 신경망 WSD 시스템에서 용언 지식을 더 잘 활용하는 방법에 초점을 맞춥니다. 우리는 맥락-용언 쌍을 구성하고 세 가지 BERT 기반 모델을 제안합니다. 사전 훈련된 BERT 모델을 SemCor3.0 훈련 말뭉치에서 미세 조정(fine-tune)하였으며, 여러 영어 전체 단어 WSD 벤치마크 데이터셋에서의 실험 결과가 우리의 접근 방식이 최신 시스템들을 능가함을 보여줍니다.