17일 전

SAIS: 문서 수준 관계 추출을 위한 중간 단계의 감독 및 증강

Yuxin Xiao, Zecheng Zhang, Yuning Mao, Carl Yang, Jiawei Han
SAIS: 문서 수준 관계 추출을 위한 중간 단계의 감독 및 증강
초록

문장 수준에서 문서 수준으로 전환함에 따라 관계 추출(Relation Extraction, RE) 연구는 텍스트 길이가 길어지고 엔티티 간 상호작용이 더욱 복잡해지면서 더욱 도전적인 과제에 직면하게 된다. 이로 인해 핵심 정보 소스—관련 맥락과 엔티티 유형—을 효과적으로 인코딩하는 것이 더욱 어려워진다. 그러나 기존의 방법들은 RE를 학습하는 과정에서 이러한 중요한 정보 소스를 암묵적으로만 학습하기 때문에, 비효율적인 감독 및 해석 불가능한 모델 예측이라는 문제에 직면한다. 반면, 본 연구에서는 RE를 위한 중간 단계를 감독하고 보강하는(Supervising and Augmenting Intermediate Steps, SAIS) 방식을 제안함으로써 모델이 관련 맥락과 엔티티 유형을 명시적으로 학습하도록 유도한다. 철저히 설계된 다양한 작업들에 기반하여, 제안하는 SAIS 방법은 더 효과적인 감독 덕분에 보다 고품질의 관계를 추출할 뿐만 아니라, 관련 근거 정보(evidence)를 더 정확하게 검색함으로써 모델의 해석 가능성도 향상시킨다. 또한 모델의 불확실성 평가를 통해 근거 기반의 데이터 증강과 앙상블 추론을 수행함으로써 성능을 추가로 향상시키면서도 계산 비용을 절감한다. 최종적으로 SAIS는 DocRED, CDR, GDA 세 가지 벤치마크에서 최고 수준의 RE 성능을 달성하였으며, 특히 DocRED에서 근거 정보 검색 성능 측면에서 2위 모델보다 상대적으로 5.04% 높은 F1 스코어를 기록하여 우수한 성과를 보였다.

SAIS: 문서 수준 관계 추출을 위한 중간 단계의 감독 및 증강 | 최신 연구 논문 | HyperAI초신경