18일 전

관계 추출을 위한 스팬 수준 모델

{Yaser Al-Onaizan, Kalpit Dixit}
관계 추출을 위한 스팬 수준 모델
초록

관계 추출(Relation Extraction)은 원시 텍스트 내에서 엔티티 언급 구간(entity mention spans)을 식별한 후, 해당 엔티티 언급 쌍 간의 관계를 파악하는 작업이다. 최근 이러한 스팬 수준(span-level) 작업을 위한 접근 방식으로 토큰 수준(token-level) 모델이 주로 사용되었으나, 이들 모델은 본질적인 한계를 가지고 있다. 즉, 스팬 수준의 특징을 쉽게 정의하고 구현할 수 없으며, 중첩되는 엔티티 언급을 모델링하기 어렵고, 순차적 디코딩(sequential decoding)을 사용함으로써 오류가 누적되는 문제가 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 모든 가능한 스팬을 직접 모델링하고, 엔티티 언급 탐지와 관계 추출을 동시에 수행하는 모델을 제안한다. 제안한 모델은 ACE2005 데이터셋에서 기존 최고 성능(60.49)을 넘어선 새로운 최고 성능인 62.83 F1을 기록하였다.