문서 수준 관계 추출을 위한 논리 규칙 학습

문서 수준 관계 추출(Document-level relation extraction)은 전체 문서 내에 존재하는 실체 간의 관계를 식별하는 것을 목표로 한다. 기존의 장거리 의존성(long-range dependencies)을 포착하기 위한 연구들은 (그래프) 신경망을 통해 암묵적으로 강력한 표현을 학습하는 데 크게 의존해 왔으며, 이는 모델의 해석 가능성(transparent)을 저하시키는 요인이 되었다. 본 논문에서는 논리 규칙을 학습함으로써 문서 수준 관계 추출을 위한 새로운 확률 모델인 LogiRE를 제안한다. LogiRE는 논리 규칙을 잠재 변수(latent variables)로 간주하며, 두 가지 모듈로 구성된다: 규칙 생성기(rule generator)와 관계 추출기(relation extractor). 규칙 생성기는 최종 예측에 기여할 수 있는 잠재적인 논리 규칙을 생성하고, 관계 추출기는 생성된 논리 규칙을 바탕으로 최종 예측을 출력한다. 이러한 두 모듈은 기대값-최대화(Expectation-Maximization, EM) 알고리즘을 통해 효율적으로 최적화될 수 있다. 신경망에 논리 규칙을 도입함으로써 LogiRE는 장거리 의존성을 명시적으로 포착할 수 있을 뿐 아니라, 더 뛰어난 해석 가능성도 확보한다. 실증 결과에 따르면, LogiRE는 여러 강력한 기준 모델들에 비해 관계 추출 성능(1.8 F1 점수 향상)과 논리 일관성(3.3 이상의 논리 점수)에서 유의미한 성능 향상을 보였다. 본 연구의 코드는 https://github.com/rudongyu/LogiRE 에서 공개되어 있다.