2달 전

그래프 컨볼루션 네트워크를 이용한 문서 날짜 추정

Shikhar Vashishth; Shib Sankar Dasgupta; Swayambhu Nath Ray; Partha Talukdar
그래프 컨볼루션 네트워크를 이용한 문서 날짜 추정
초록

문서 날짜는 문서 검색, 요약, 이벤트 감지 등의 많은 중요한 작업에서 필수적입니다. 기존의 이러한 작업에 대한 접근 방식은 문서 날짜에 대한 정확한 지식을 가정하지만, 이는 항상 가능하지 않으며 특히 웹에서 임의로 수집된 문서의 경우 더욱 그렇습니다. 문서 작성일 추정은 문서의 시간 구조를 추론해야 하는 어려운 문제입니다. 과거의 문서 작성일 추정 시스템들은 주로 수작업으로 만든 특징에 의존하면서 이러한 문서 내부 구조를 무시했습니다. 본 논문에서는 문법적 및 시간적 그래프 구조를 원칙적으로 함께 활용하는 그래프 컨볼루션 네트워크(GCN) 기반의 문서 작성일 추정 방법인 NeuralDater를 제안합니다. 최선의 지식으로 판단할 때, 이는 문서 작성일 추정 문제에 대한 딥 러닝의 첫 번째 응용 사례입니다. 실제 데이터셋을 사용한 광범위한 실험을 통해 NeuralDater가 최신 기준 모델보다 절대적으로 19% (상대적으로 45%) 더 높은 정확도를 보이는 것으로 확인되었습니다.

그래프 컨볼루션 네트워크를 이용한 문서 날짜 추정 | 최신 연구 논문 | HyperAI초신경