2달 전
ReLiK: Retrieve and LinK, 학술적 예산으로 빠르고 정확한 실체 연결 및 관계 추출
Orlando, Riccardo ; Cabot, Pere-Lluis Huguet ; Barba, Edoardo ; Navigli, Roberto

초록
엔티티 링킹(EL)과 관계 추출(RE)은 자연어 처리의 기본적인 작업으로, 다양한 응용 프로그램에서 중요한 구성 요소로 작용합니다. 본 논문에서는 EL과 RE를 모두 수행하기 위한 검색기-리더 아키텍처인 ReLiK를 제안합니다. 이 아키텍처는 입력 텍스트가 주어졌을 때, 검색기 모듈이 텍스트 내에 잠재적으로 나타날 수 있는 후보 엔티티나 관계를 식별하는 역할을 합니다. 이후 리더 모듈은 적절한 검색된 엔티티나 관계를 판단하고, 해당 텍스트 범위와 일치시키는 작업을 수행합니다. 특히, 우리는 후보 엔티티나 관계를 텍스트와 함께 통합하는 혁신적인 입력 표현 방식을 제시하는데, 이를 통해 단일 순방향 패스에서 엔티티 링킹이나 관계 추출이 가능하며, 사전 학습된 언어 모델의 문맥화 능력을 충분히 활용할 수 있습니다. 이는 이전의 검색기-리더 기반 방법들과 대조되는데, 이전 방법들은 각 후보마다 순방향 패스가 필요했습니다. 우리의 EL과 RE 공식화는 학술 예산으로 학습하면서도 도메인 내 및 도메인 외 벤치마크에서 최고 수준의 성능을 달성하며, 경쟁 모델들보다 최대 40배 빠른 추론 속도를 제공합니다. 마지막으로, 우리는 공유 리더를 사용하여 동시에 엔티티와 관계를 추출함으로써 정보 추출(cIE), 즉 EL + RE를 원활하게 수행할 수 있는 방법을 소개하며, 새로운 최고 수준의 성능을 설정하였습니다.