17일 전

문서 수준 관계 추출을 통한 의미 분할

Ningyu Zhang, Xiang Chen, Xin Xie, Shumin Deng, Chuanqi Tan, Mosha Chen, Fei Huang, Luo Si, Huajun Chen
문서 수준 관계 추출을 통한 의미 분할
초록

문서 수준 관계 추출은 문서 내 여러 개의 엔티티 쌍 간의 관계를 추출하는 것을 목표로 한다. 기존에 제안된 그래프 기반 또는 트랜스포머 기반 모델들은 관계 삼중항 간의 전반적인 정보를 무시한 채 각 엔티티를 독립적으로 처리한다. 본 논문은 관계 삼중항 간의 국소적 및 전역적 정보를 포착하기 위해 엔티티 수준의 관계 행렬을 예측하는 방식으로 문제를 접근하며, 이는 컴퓨터 비전 분야의 시맨틱 세그멘테이션 작업과 유사한 접근법을 취한다. 본 연구에서는 문서 수준 관계 추출을 위한 Document U-shaped Network를 제안한다. 구체적으로, 엔티티의 맥락 정보를 추출하기 위해 인코더 모듈을 활용하고, 이미지 스타일의 특징 맵 위에 U-shaped 세그멘테이션 모듈을 적용하여 삼중항 간의 전역적 상호의존성을 포착한다. 실험 결과, 제안하는 방법은 DocRED, CDR, GDA 세 가지 벤치마크 데이터셋에서 최신 기술(SOTA) 수준의 성능을 달성함을 확인하였다.

문서 수준 관계 추출을 통한 의미 분할 | 최신 연구 논문 | HyperAI초신경