3달 전
에이더: 효율적인 증거 추출과 추론 단계 융합을 통한 문서 수준 관계 추출 강화
Yiqing Xie, Jiaming Shen, Sha Li, Yuning Mao, Jiawei Han

초록
문서 수준 관계 추출(Document-level relation extraction, DocRE)은 문서 내 엔티티 쌍 간의 의미적 관계를 추출하는 것을 목표로 한다. 기존의 전형적인 DocRE 방법들은 문서 전체를 입력으로 처리하지만, 인간이 엔티티 쌍의 관계를 예측하는 데에는 문서 내 일부 문장, 즉 증거(evidence)만으로도 충분한 경우가 많다. 본 논문에서는 효율적인 증거 추출과 추출된 증거의 효과적인 융합을 통해 DocRE 성능을 향상시키는 증거 강화 프레임워크인 Eider를 제안한다. 먼저, 가벼운 증거 추출 모델과 관계 추출(RE) 모델을 공동으로 학습시켜 메모리 및 실행 시간 측면에서 효율성을 확보한다. 실증적으로, 본 연구에서 제안한 휴리스틱 규칙을 통해 생성한 실버 레이블(silver labels)로 증거 모델을 학습하는 것만으로도 RE 성능이 향상됨을 확인하였다. 또한, 추출된 증거와 전체 문서를 모두 대상으로 관계 예측을 수행한 후, 블렌딩 레이어(blending layer)를 통해 예측 결과를 융합하는 간단하면서도 효과적인 추론 과정을 설계하였다. 이는 Eider가 중요한 문장에 집중하면서도 문서 전체 정보에 접근할 수 있도록 한다. 광범위한 실험 결과, Eider는 세 가지 벤치마크 데이터셋에서 최첨단 기법들을 초월하며, 특히 DocRED에서 Ign F1과 F1 기준으로 각각 1.37점, 1.26점의 성능 향상을 달성하였다.