
초록
문서 수준 관계 추출(Document-level relation extraction, RE)은 전체 문서에 걸쳐 존재하는 실체 간의 관계를 식별하는 것을 목표로 한다. 이를 위해서는 핵심 참조(coreference) 및 보편 지식(commonsense)과 같은 다양한 지식을 통합하는 복잡한 추론 능력이 필요하다. 대규모 지식 그래프(Knowledge Graph, KG)는 현실 세계의 풍부한 사실들을 포함하고 있으며, 문서 수준 RE에 유용한 지식을 제공할 수 있다. 본 논문에서는 기존 문서 수준 RE 모델의 성능을 향상시키기 위해 실체 지식 주입(entity knowledge injection) 프레임워크를 제안한다. 구체적으로, 핵심 참조 지식을 주입하기 위해 핵심 참조 정제(coreference distillation) 기법을 도입하여 RE 모델이 더 일반화된 핵심 참조 추론 능력을 갖도록 한다. 또한, 표현 일치(representation reconciliation) 기법을 활용하여 사실 지식을 주입하고, 지식 그래프의 표현과 문서 표현을 통합된 공간에 집계한다. 두 가지 벤치마크 데이터셋에서 수행한 실험을 통해 제안하는 실체 지식 주입 프레임워크의 일반화 능력과 다양한 문서 수준 RE 모델에 대한 일관된 성능 향상이 입증되었다.