17일 전
위치에 민감한 시퀀스 레이블링을 이용한 엔티티 및 겹치는 관계의 공동 추출
{Xinyan Xiao, Qiaoqiao She, Yajuan Lyu, Dai Dai, Shan Dou, Haifeng Wang}
초록
공동 엔티티 및 관계 추출은 단일 모델을 사용하여 엔티티와 관계를 동시에 탐지하는 작업이다. 본 논문에서는 쿼리 단어 위치 p에 따라 엔티티 및 관계 레이블을 직접 태깅하는 새로운 통합 공동 추출 모델을 제안한다. 즉, 위치 p에서 엔티티를 탐지하고, 다른 위치에 존재하는, 해당 엔티티와 관계를 맺는 엔티티를 식별한다. 이를 위해 먼저 n개의 단어로 구성된 문장에 대해 n개의 태그 시퀀스를 생성할 수 있는 태깅 체계를 설계한다. 이후 각 쿼리 위치에 대해 다른 문장 표현을 생성할 수 있도록 위치에 기반한 어텐션 메커니즘을 도입하여, 이러한 n개의 태그 시퀀스를 모델링한다. 이러한 방식으로 본 방법은 모든 엔티티와 그 유형을 동시에 추출할 뿐만 아니라, 중첩된 관계도 모두 추출할 수 있다. 실험 결과, 본 프레임워크는 중첩된 관계 추출 및 장거리 관계 탐지에서 기존 방법 대비 상당한 성능 향상을 보였으며, 두 개의 공개 데이터셋에서 최신 기술(SOTA) 수준의 성능을 달성하였다.