
초록
엔티티 링킹은 텍스트의 구간을 온톨로지나 지식 출처에 연결하여 구조화된 데이터를 생성하는 연구 분야 중 하나입니다. 본 논문에서는 각 개별 입력 토큰을 엔티티로 분류하고, 토큰 예측 값을 집계하는 방식으로 엔티티 링킹에 구조적 예측을 적용하는 방법을 재검토합니다. 우리 시스템인 SpEL (Structured prediction for Entity Linking)은 이 새로운 아이디어들을 활용하여 엔티티 링킹 작업에 구조적 예측을 적용하는 최신 엔티티 링킹 시스템으로, 다음과 같은 특징을 포함하고 있습니다: 두 가지 개선된 미세 조정 단계; 문맥에 민감한 예측 집계 전략; 모델의 출력 어휘 크기 감소; 그리고 엔티티 링킹 시스템에서 일반적으로 발생하는 학습과 추론 간의 토크나이제이션 불일치 문제를 해결합니다. 실험 결과, SpEL은 위키피디아 엔티티 링킹을 위한 일반적으로 사용되는 AIDA 벤치마크 데이터셋에서 기존 최신 기술보다 우수한 성능을 보임을 확인할 수 있었습니다. 또한, 본 방법은 매개변수 수와 추론 속도 측면에서 매우 효율적인 계산 능력을 가지고 있습니다.