
초록
관계 추출(Relation Extraction, RE)은 주어진 두 개의 실체 간의 관계를 예측하는 중요한 자연어 처리 작업으로, 뛰어난 모델 성능을 달성하기 위해 맥락 정보에 대한 깊은 이해가 필수적이다. 다양한 유형의 맥락 정보 중에서 자동 생성된 구문 정보(즉, 단어 간 의존 관계)는 이 작업에 효과적임이 입증되었다. 그러나 기존의 대부분의 연구들은 구문 정보를 활용하기 위해 기존 기준 아키텍처에 수정을 가해야 하는데, 예를 들어 인코더 위에 GCN과 같은 새로운 구성 요소를 추가하는 방식이다. 이러한 문제를 해결하기 위해 본 연구에서는 의존성 마스킹을 통해 자동 파싱된 데이터를 활용하여 구문 유도형 인코더(syntax-induced encoder)를 훈련하는 방식으로 구문 정보를 활용하는 대안적인 접근을 제안한다. 구체적으로, 이 구문 유도형 인코더는 일차, 이차, 삼차 순서의 마스킹된 의존 연결 및 종류를 복원하도록 훈련되며, 기존 연구들이 의존 경로를 따라 주변 단어를 예측하는 방식으로 언어 모델이나 단어 임베딩을 훈련하는 것과 크게 다르다. ACE2005EN 및 SemEval 2010 Task 8 두 개의 영어 벤치마크 데이터셋에서의 실험 결과는 제안하는 방법이 관계 추출에 효과적임을 입증하였으며, 강력한 기준 모델들을 능가하고 두 데이터셋에서 최고 성능(SOTA)을 달성함을 보였다.