3달 전

문서 수준 관계 추출을 위한 구조 강화 트랜스포머 인코더

{Wanlong Liu}
문서 수준 관계 추출을 위한 구조 강화 트랜스포머 인코더
초록

문서 수준 관계 추출은 문서 내 엔티티 쌍 간의 관계적 사실을 탐지하는 것을 목표로 하며, 최근 들어 점점 더 많은 주목을 받고 있다. 기존의 대부분의 방법은 주로 그래프 기반 및 트랜스포머 기반 접근법으로 요약할 수 있다. 그러나 기존의 트랜스포머 기반 방법들은 엔티티 간의 구조적 정보를 간과하는 반면, 그래프 기반 방법들은 인코딩 단계와 구조적 추론 단계를 분리함으로써 구조적 정보를 효과적으로 추출하지 못하는 한계를 지닌다. 본 논문에서는 트랜스포머 인코더에 엔티티의 구조적 정보를 통합하는 효과적인 구조 강화 트랜스포머 인코더 모델(Structure-Enhanced Transformer Encoder, SETE)을 제안한다. 먼저 엔티티 언급 간의 의존 관계를 기반으로 언급 수준의 그래프를 정의하고 이를 토큰 수준의 그래프로 변환한다. 이후 엔티티 간의 구조적 정보와 맥락적 정보를 풍부하게 하여 기존 트랜스포머 인코더의 추론 능력을 향상시키는 이중 자기주의(self-attention) 메커니즘을 설계한다. 세 개의 공개 데이터셋에서 수행된 실험 결과, 제안한 SETE는 기존 최고 성능 모델들을 상회하며, 추가적인 분석을 통해 본 모델의 해석 가능성(해석 가능성)이 뛰어나다는 점이 확인되었다.