
초록
문서 수준 관계 추출은 문서 내 여러 문장 간의 정보를 통합하고 문장 간 실체 간의 복잡한 상호작용을 포착해야 하는 과제를 요구한다. 그러나 문서 내 관련 정보를 효과적으로 통합하는 것은 여전히 도전적인 연구 과제로 남아 있다. 기존의 접근법들은 비구조화된 텍스트로부터 문법 트리, 공참조, 또는 휴리스틱 기반으로 정적 문서 수준 그래프를 구성하여 종속 관계를 모델링한다. 이전 방법들은 추론 과정에서 풍부한 비국소적 상호작용을 포착하지 못할 수 있다는 한계가 있다. 본 연구에서는 잠재적 문서 수준 그래프를 자동으로 유도함으로써 문장 간 관계 추론을 강화하는 새로운 모델을 제안한다. 또한 다단계 추론을 위한 관련 정보를 점진적으로 통합할 수 있도록 하는 개선 전략을 개발하였다. 구체적으로, 본 모델은 대규모 문서 수준 데이터셋(DocRED)에서 F1 스코어 59.05를 달성하여 기존 결과를 크게 개선하였으며, CDR 및 GDA 데이터셋에서도 새로운 최고 성능을 기록하였다. 더 나아가, 광범위한 분석을 통해 모델이 보다 정확한 문장 간 관계를 탐지할 수 있음을 입증하였다.