17일 전

문서 수준 관계 추출을 위한 논리 규칙 학습

Dongyu Ru, Changzhi Sun, Jiangtao Feng, Lin Qiu, Hao Zhou, Weinan Zhang, Yong Yu, Lei Li
문서 수준 관계 추출을 위한 논리 규칙 학습
초록

문서 수준 관계 추출(Document-level relation extraction)은 전체 문서 내에 존재하는 실체 간의 관계를 식별하는 것을 목표로 한다. 기존의 장거리 의존성(long-range dependencies)을 포착하기 위한 연구들은 (그래프) 신경망을 통해 암묵적으로 강력한 표현을 학습하는 데 크게 의존해 왔으며, 이는 모델의 해석 가능성(transparent)을 저하시키는 요인이 되었다. 본 논문에서는 논리 규칙을 학습함으로써 문서 수준 관계 추출을 위한 새로운 확률 모델인 LogiRE를 제안한다. LogiRE는 논리 규칙을 잠재 변수(latent variables)로 간주하며, 두 가지 모듈로 구성된다: 규칙 생성기(rule generator)와 관계 추출기(relation extractor). 규칙 생성기는 최종 예측에 기여할 수 있는 잠재적인 논리 규칙을 생성하고, 관계 추출기는 생성된 논리 규칙을 바탕으로 최종 예측을 출력한다. 이러한 두 모듈은 기대값-최대화(Expectation-Maximization, EM) 알고리즘을 통해 효율적으로 최적화될 수 있다. 신경망에 논리 규칙을 도입함으로써 LogiRE는 장거리 의존성을 명시적으로 포착할 수 있을 뿐 아니라, 더 뛰어난 해석 가능성도 확보한다. 실증 결과에 따르면, LogiRE는 여러 강력한 기준 모델들에 비해 관계 추출 성능(1.8 F1 점수 향상)과 논리 일관성(3.3 이상의 논리 점수)에서 유의미한 성능 향상을 보였다. 본 연구의 코드는 https://github.com/rudongyu/LogiRE 에서 공개되어 있다.

문서 수준 관계 추출을 위한 논리 규칙 학습 | 최신 연구 논문 | HyperAI초신경