18일 전
문서 수준 관계 추출을 위한 적응형 임계값 및 국소적 컨텍스트 풀링
Wenxuan Zhou, Kevin Huang, Tengyu Ma, Jing Huang

초록
문서 수준 관계 추출(Document-level relation extraction, RE)은 문장 수준의 관계 추출과 비교하여 새로운 도전 과제를 제시한다. 일반적으로 하나의 문서 내에는 여러 개의 엔티티 쌍이 포함되며, 각 엔티티 쌍은 문서 내에서 여러 번 등장하면서 다양한 가능한 관계와 연결될 수 있다. 본 논문에서는 다중 레이블 및 다중 엔티티 문제를 해결하기 위해 두 가지 새로운 기법, 적응형 임계값(adaptive thresholding)과 국소적 컨텍스트 풀링(localized context pooling)을 제안한다. 적응형 임계값 기법은 기존 연구에서 사용하는 전역 임계값(global threshold)을 대체하여, 각 엔티티에 따라 학습 가능한 의존적 임계값을 도입한다. 국소적 컨텍스트 풀링 기법은 사전 훈련된 언어 모델의 어텐션을 직접 활용하여, 관계 결정에 유용한 관련 컨텍스트를 정확히 위치시키는 데 기여한다. 제안한 ATLOP(Adaptive Thresholding and Localized cOntext Pooling) 모델은 DocRED, 최근에 공개된 대규모 관계 추출 데이터셋과 생물의학 분야의 두 개의 데이터셋인 CDR 및 GDA에서 실험을 수행하였으며, F1 스코어 63.4를 달성하였고, CDR 및 GDA 데이터셋에서 기존 모델들에 비해 유의미하게 우수한 성능을 보였다.