2달 전

엔티티 해소를 위한 융합 엔티티 디코딩

Junxiong Wang; Ali Mousavi; Omar Attia; Ronak Pradeep; Saloni Potdar; Alexander M. Rush; Umar Farooq Minhas; Yunyao Li
엔티티 해소를 위한 융합 엔티티 디코딩
초록

엔티티 해소(Entity Disambiguation, ED)는 지식 기반에서 모호한 엔티티의 언급을 해당 엔티티로 연결하는 역할을 하는 엔티티 링킹(Entity Linking, EL)의 핵심 구성 요소입니다. 기존의 생성적 접근 방식은 ZELDA 벤치마크 하에서 분류 접근 방식보다 정확도가 향상된 것을 보여주었습니다. 그러나 생성적 접근 방식은 대규모 사전 학습이 필요하고, 생성 효율성이 떨어지는 문제를 가지고 있습니다. 무엇보다도, 유사한 엔티티를 구분하기 위한 중요한 정보를 포함할 수 있는 엔티티 설명이 종종 간과되고 있습니다. 우리는 이러한 문제점을 해결하기 위해 더 상세한 엔티티 설명을 사용하여 엔티티를 해소하는 인코더-디코더 모델을 제안합니다. 주어진 텍스트와 후보 엔티티에 대해 인코더는 텍스트와 각 후보 엔ти티 사이의 상호작용을 학습하여 각 후보 엔티티에 대한 표현을 생성합니다. 이후 디코더는 후보 엔티تي들의 표현을 융합하여 올바른 엔티티를 선택합니다. 우리는 다양한 엔터디 해소 벤치마크에서 수행한 실험들을 통해 이 모델의 강력하고 안정적인 성능을 입증하였으며, 특히 ZELDA 벤치마크에서는 GENRE와 비교해 +1.5%의 성능 향상을 보였습니다. 또한, 이 접근 방식을 검색/리더 프레임워크에 통합하여 GERBIL 벤치마크에서 EntQA와 비교해 +1.5%의 성능 향상을 관찰하였습니다.번역 노트:- "Entity disambiguation"는 "엔터디 해소" 또는 "엔터디 구별"로 번역되지만, 여기서는 "엔터디 해소"로 일관성 있게 번역하였습니다.- "ZELDA benchmark"와 "GERBIL benchmark"는 공통적으로 사용되는 벤치마크 이름으로 그대로 유지하였습니다.- "GENRE"와 "EntQA"는 관련 연구에서 사용되는 알고리즘이나 시스템 이름으로 그대로 유지하였습니다.