11일 전

지식 기반 정보를 엔드 투 엔드 종합 엔티티 및 관계 추출 및 코레퍼런스 해결에 통합하는 방법

Severine Verlinden, Klim Zaporojets, Johannes Deleu, Thomas Demeester, Chris Develder
지식 기반 정보를 엔드 투 엔드 종합 엔티티 및 관계 추출 및 코레퍼런스 해결에 통합하는 방법
초록

우리는 전체 문서를 대상으로 명명된 실체 인식(NER), 공명 해결(Coreference Resolution), 관계 추출(Relextraction)을 공동으로 해결하는 통합 정보 추출(IE) 모델을 고려한다. 특히, 이러한 IE 모델에 지식 기반(KB)의 정보를 어떻게 주입할 수 있는지에 대해 비지도 실체 연결(unsupervised entity linking, EL) 기반으로 연구한다. 사용된 KB 내 실체 표현은 (i) 하이퍼링크가 연결된 텍스트 문서(위키백과) 또는 (ii) 지식 그래프(위키데이터)로부터 학습되며, 두 가지 방식은 IE 성능 향상에서 서로 보완적인 역할을 한다. 대응하는 실체 연결(EL) 후보들의 표현을 입력 문서의 텍스트 스팬 표현에 추가하고, (i) 위키백과 기반 사전 확률에 따라 EL 후보 표현들의 가중 평균을 취하거나, (ii) EL 후보 목록에 대해 어텐션(attention) 기반 방식을 사용하는 두 가지 접근법을 실험한다. 실험 결과, 두 데이터셋에서 평가된 IE 작업에서 F1 점수 최대 5%의 향상이 나타났다. 사전 확률 기반 모델이 강력한 성능을 보였음에도 불구하고, 정량적 및 정성적 분석을 통해 어텐션 기반 접근법의 우수성이 확인되었다.

지식 기반 정보를 엔드 투 엔드 종합 엔티티 및 관계 추출 및 코레퍼런스 해결에 통합하는 방법 | 최신 연구 논문 | HyperAI초신경