18일 전

문서 수준 관계 추출을 위한 적응형 힌지 밸런스 손실

{Cailian Chen, Xiaodi Peng, Xinyi Le, Jize Wang}
문서 수준 관계 추출을 위한 적응형 힌지 밸런스 손실
초록

문서 수준 관계 추출(Document-Level Relation Extraction)은 여러 문장에서 엔티티 간의 관계를 예측하는 것을 목표로 한다. 일반적인 접근 방식은 다중 레이블 분류의 임계값을 설정하여 엔티티 쌍 간에 관계가 존재하는지 여부를 결정하는 것이다. 그러나 문서 수준 작업에서는 대부분의 엔티티 쌍이 관계를 나타내지 않기 때문에 긍정 클래스와 부정 클래스 간에 극도로 불균형한 분포가 발생한다. 본 연구에서는 이러한 불균형 문제로 인해 임계값 설정에 악영향을 미치고, 잘못된 "관계 없음" 예측을 초래할 수 있다고 주장한다. 이에 따라 본 논문에서는 각 관계에 대한 예측 점수와 분류 임계값 사이의 거리를 활용하여 쉬운 부정 샘플을 가중치를 낮추는 방법을 제안한다. 제안하는 새로운 적응형 힌지 균형 손실(Adaptive Hinge Balance Loss)은 이 거리를 통해 각 관계 클래스의 어려움을 측정함으로써, 잘못 분류된 어려운 관계—즉 소수의 긍정 관계—에 더 많은 주의를 기울인다. Re-DocRED 데이터셋에서의 실험 결과는 본 방법이 다른 균형화 기법들에 비해 우수함을 입증하였다. 소스 코드는 다음 주소에서 확인할 수 있다: https://github.com/Jize-W/HingeABL.