
초록
문서 수준 관계 추출(Document-level relation extraction, DocRE)은 문서 내 각 엔티티 쌍 간의 모든 관계를 식별하는 작업이다. 관계 추출에 대한 단서를 담고 있는 문장으로 정의되는 증거(evidence)는 DocRE 시스템이 관련 텍스트에 집중하도록 도와 관계 추출 성능을 향상시킨다는 점에서 유용함이 입증되었다. 그러나 DocRE에서의 증거 검색(evidence retrieval, ER)은 두 가지 주요 문제에 직면해 있다: 높은 메모리 소모와 레이블링된 증거 데이터의 부족이다. 본 연구는 이러한 문제를 해결함으로써 ER의 효율적 활용을 개선하는 것을 목표로 한다. 먼저, 증거 정보를 감독 신호로 활용하여 주의 집중(attention) 모듈이 증거 문장에 높은 가중치를 부여하도록 유도하는 메모리 효율적인 접근법인 DREEAM을 제안한다. 둘째, DREEAM을 위한 자가 학습(self-training) 전략을 제안하여, 증거 레이블이 없는 막대한 데이터에서 자동으로 생성된 증거를 기반으로 ER을 학습한다. 실험 결과, 본 연구의 접근법은 DocRE 및 ER 모두에서 DocRED 벤치마크에서 최고 성능을 보였다. 우리 지식에 따르면, DREEAM은 ER 자가 학습을 적용한 최초의 접근법이다.