17일 전

엔티티와 관계의 공동 추출: 새로운 분해 전략 기반

Bowen Yu, Zhenyu Zhang, Xiaobo Shu, Yubin Wang, Tingwen Liu, Bin Wang, Sujian Li
엔티티와 관계의 공동 추출: 새로운 분해 전략 기반
초록

엔티티와 관계의 공동 추출은 단일 모델을 이용하여 엔티티 쌍과 그에 해당하는 관계를 동시에 탐지하는 것을 목표로 한다. 기존의 연구들은 일반적으로 추출-분류(extract-then-classify) 또는 통합 레이블링(unified labeling) 방식을 통해 이 작업을 수행한다. 그러나 이러한 방법들은 혹은 중복된 엔티티 쌍으로 인한 문제를 겪거나, 엔티티와 관계를 추출하는 과정에서 중요한 내부 구조를 무시하는 단점을 가지고 있다. 이러한 한계를 해결하기 위해 본 논문에서는 공동 추출 작업을 두 개의 상호 연관된 하위 작업으로 분해한다. 첫 번째 하위 작업은 목표 관계와 관련될 수 있는 모든 헤드 엔티티(Head Entity)를 식별하는 HE 추출이고, 두 번째 하위 작업은 추출된 각 헤드 엔티티에 대해 대응하는 테일 엔티티(Tail Entity)와 관계를 식별하는 TER 추출이다. 이후 본 논문에서 제안하는 스팬 기반 태깅 체계(span-based tagging scheme)를 기반으로, 이러한 두 하위 작업을 여러 개의 시퀀스 레이블링 문제로 추가적으로 분해하며, 계층적 경계 태거(hierarchical boundary tagger)와 다중 스팬 디코딩 알고리즘(multi-span decoding algorithm)을 통해 효율적으로 해결할 수 있다. 합리적인 작업 분해 전략 덕분에, 본 모델은 각 단계 간의 의미적 상호의존성을 충분히 포착할 수 있을 뿐만 아니라, 관련 없는 엔티티 쌍으로 인한 노이즈를 줄일 수 있다. 실험 결과, 제안한 방법은 기존의 최선의 방법보다 F1 점수 기준으로 각각 5.2%, 5.9%, 21.5% 우수한 성능을 기록하며, 세 가지 공개 데이터셋에서 새로운 최고 성능(state-of-the-art)을 달성하였다.

엔티티와 관계의 공동 추출: 새로운 분해 전략 기반 | 최신 연구 논문 | HyperAI초신경