3달 전

효율적인 장거리 관계 추출을 위한 DG-SpanBERT

Jun Chen, Robert Hoehndorf, Mohamed Elhoseiny, Xiangliang Zhang
효율적인 장거리 관계 추출을 위한 DG-SpanBERT
초록

자연어 처리 분야에서 관계 추출은 비구조화된 텍스트를 합리적으로 이해하는 것을 목표로 한다. 본 연구에서는 사전 훈련된 언어 모델인 SpanBERT와 그래프 컨볼루션 네트워크(GCN)를 활용하여 원시 문장으로부터 의미적 특징을 추출하는 새로운 스팬 기반 그래프 컨볼루션 네트워크(DG-SpanBERT)를 제안한다. DG-SpanBERT 모델은 대규모 코퍼스로부터 풍부한 어휘적 특징을 학습하는 데 있어 SpanBERT의 장점을 계승하며, 의존성 트리에 GCN을 적용함으로써 엔티티 간의 장거리 관계를 효과적으로 포착할 수 있는 능력을 갖추고 있다. 실험 결과, 기존의 의존성 기반 및 시퀀스 기반 모델들을 모두 상회하며, TACRED 데이터셋에서 최고 수준의 성능을 달성하였다.