17일 전
문서 수준 관계 추출을 통한 의미 분할
Ningyu Zhang, Xiang Chen, Xin Xie, Shumin Deng, Chuanqi Tan, Mosha Chen, Fei Huang, Luo Si, Huajun Chen

초록
문서 수준 관계 추출은 문서 내 여러 개의 엔티티 쌍 간의 관계를 추출하는 것을 목표로 한다. 기존에 제안된 그래프 기반 또는 트랜스포머 기반 모델들은 관계 삼중항 간의 전반적인 정보를 무시한 채 각 엔티티를 독립적으로 처리한다. 본 논문은 관계 삼중항 간의 국소적 및 전역적 정보를 포착하기 위해 엔티티 수준의 관계 행렬을 예측하는 방식으로 문제를 접근하며, 이는 컴퓨터 비전 분야의 시맨틱 세그멘테이션 작업과 유사한 접근법을 취한다. 본 연구에서는 문서 수준 관계 추출을 위한 Document U-shaped Network를 제안한다. 구체적으로, 엔티티의 맥락 정보를 추출하기 위해 인코더 모듈을 활용하고, 이미지 스타일의 특징 맵 위에 U-shaped 세그멘테이션 모듈을 적용하여 삼중항 간의 전역적 상호의존성을 포착한다. 실험 결과, 제안하는 방법은 DocRED, CDR, GDA 세 가지 벤치마크 데이터셋에서 최신 기술(SOTA) 수준의 성능을 달성함을 확인하였다.