17일 전
명시적 언급-언급 공통참조 모델링을 통한 엔터티 링킹
{Andrew McCallum, Nicholas Monath, Rico Angell, Dhruv Agarwal}

초록
엔티티 언급의 표현 학습은 후보 생성 및 링킹 예측을 위한 현대적인 엔티티 링킹 시스템의 핵심 구성 요소이다. 본 논문에서는 문서 간 언급과 엔티티들 위에 최소 신장 방향 트리(Minimum Spanning Arborescences, 즉 방향 신장 트리)를 구축함으로써 언급의 핵심 참조 관계를 명시적으로 모델링하는 새로운 학습 방법을 제안하고, 이를 실증적으로 분석한다. 제안하는 방법의 효과성을 입증하기 위해, 제로샷 엔티티 링킹 데이터셋과 가장 큰 공개 생물의학 데이터셋인 MedMentions에서 후보 생성의 재현율과 링킹 정확도 모두에서 유의미한 향상을 보였다. 또한, 후보 생성 성능 향상이 하류에서 보다 고품질의 재정렬 모델을 가능하게 함을 보여주며, MedMentions에서 링킹 정확도 측면에서 새로운 SOTA(SOTA: State-of-the-Art) 성과를 달성하였다. 마지막으로, 개선된 언급 표현이 문서 간 핵심 참조를 통한 새로운 엔티티 탐지에도 효과적임을 입증하였다.