9일 전
엔티티 링킹을 위한 명명된 엔티티 인식: 무엇이 효과적인가, 그리고 앞으로의 방향
{Roberto Navigli, Francesco Cecconi, Simone Conia, Simone Tedeschi}

초록
엔티티 링킹(EL) 시스템은 최근에 등장한 사전 훈련된 언어 모델이 제공하는 문맥 기반 표현 덕분에 표준 벤치마크에서 놀라운 성과를 달성해왔다. 그러나 이러한 시스템은 최고의 성능을 발휘하기 위해 수백만 개의 레이블링된 예제와 같은 막대한 데이터를 요구하며, 특히 제한된 계산 자원을 가진 환경에서는 훈련 시간이 종종 며칠을 초과하는 경우가 있다. 본 논문에서는 명명된 엔티티 인식(NER)이 레이블링된 데이터의 양이 많고 적은 경우에 따라 EL 시스템 간의 성능 격차를 좁히는 데 어떻게 활용될 수 있는지를 탐구한다. 구체적으로, EL 시스템이 NER을 통해 엔티티 표현을 강화하고, 후보 엔티티 선택을 개선하며, 더 효과적인 음성 샘플(음성 예시)을 선택하며, 출력 엔티티에 대해 하드 및 소프트 제약 조건을 적용하는 데 어떻게 기여할 수 있는지를 보여준다. 본 연구의 소프트웨어(코드 및 모델 체크포인트)는 https://github.com/Babelscape/ner4el 에서 공개된다.