2달 전

Doc2EDAG: 중국 금융 이벤트 추출을 위한 엔드투엔드 문서 수준 프레임워크

Shun Zheng; Wei Cao; Wei Xu; Jiang Bian
Doc2EDAG: 중국 금융 이벤트 추출을 위한 엔드투엔드 문서 수준 프레임워크
초록

대부분의 기존 사건 추출(Event Extraction, EE) 방법은 문장 범위 내에서만 사건 인자를 추출합니다. 그러나 이러한 문장 수준의 EE 방법은 금융, 입법, 의료 등과 같은 신규 응용 분야에서 급증하는 문서 양을 처리하기 어려워집니다. 이는 사건 인자가 다른 문장에 흩어져 있으며, 때로는 동일한 문서 내에 여러 개의 그러한 사건 언급이 공존하기 때문입니다. 이러한 도전 과제를 해결하기 위해, 우리는 문서 수준의 EE(Document-level Event Extraction, DEE)를 효과적으로 수행할 수 있는 새로운 엔드투엔드 모델인 Doc2EDAG를 제안합니다. 또한, 문서 수준의 사건 라벨링을 용이하게 하기 위해 트리거 단어가 없는 설계(no-trigger-words design)를 통해 DEE 작업을 재정립하였습니다.Doc2EDAG의 효과성을 입증하기 위해, 우리는 위와 같은 도전 과제를 포함하는 중국 금융 공시문으로 구성된 대규모 실제 데이터셋을 구축하였습니다. 광범위한 실험과 종합적인 분석을 통해 Doc2EDAG가 최신 방법론보다 우수함을 보여주었습니다. 데이터와 코드는 https://github.com/dolphin-zs/Doc2EDAG에서 확인할 수 있습니다.

Doc2EDAG: 중국 금융 이벤트 추출을 위한 엔드투엔드 문서 수준 프레임워크 | 최신 연구 논문 | HyperAI초신경