
초록
엔티티 링킹의 전통적인 접근 방식은 주어진 문서 내에서 언급(mention)을 먼저 탐지한 후, 지식 기반에서 해당 언급의 실제 엔티티를 추론하는 것이다. 이 방법의 잘 알려진 한계는 엔티티를 알지 못한 채 언급을 찾아야 한다는 점으로, 자연스럽지도 않고 어렵다. 우리는 이러한 한계를 겪지 않는 새로운 모델인 EntQA(엔티티 링킹을 질의 응답으로 보는 접근)를 제안한다. EntQA는 먼저 빠른 검색 모듈을 통해 후보 엔티티를 제안하고, 이후 강력한 리더 모듈을 통해 문서를 세밀히 분석하여 각 후보 엔티티에 해당하는 언급을 탐지한다. 본 연구는 엔티티 링킹 분야의 발전과 개방형 도메인 질의 응답 기술의 진보를 결합하며, 밀집 엔티티 검색과 독해 이해를 위한 사전 훈련된 모델을 활용한다. 기존 연구들과 달리, 본 모델은 언급-후보 사전이나 대규모 약한 감독(weak supervision)에 의존하지 않는다. EntQA는 GERBIL 벤치마킹 플랫폼에서 뛰어난 성능을 달성하였다.