2달 전
KPI-EDGAR: 금융 문서에서 관계 추출을 위한 새로운 데이터셋 및 동반 지표
Tobias Deußer; Syed Musharraf Ali; Lars Hillebrand; Desiana Nurchalifah; Basil Jacob; Christian Bauckhage; Rafet Sifa

초록
우리는 전자 데이터 수집, 분석 및 검색(EDGAR) 시스템에 업로드된 재무 보고서를 기반으로 하는 새로운 데이터셋인 KPI-EDGAR를 소개합니다. 이 데이터셋의 주요 목표는 재무 문서에서 주요 성과 지표(KPIs)를 추출하고 이를 숫자 값과 다른 속성들에 연결하는 것입니다. 또한, 잠재적인 향후 연구를 위한 벤치마킹을 위해 동반되는 네 가지 기준 모델을 제공합니다. 더불어, 이 영역에서 관계의 엔티티 쌍이 본질적으로 모호한 경계를 더 잘 모델링하기 위해 기존의 F1 점수에 단어 수준 가중치 방식을 통합하여 said 추출 과정의 성공률을 측정하는 새로운 방법을 제안합니다.注释:在最后一句中,“said”一词在韩语中没有直接对应的翻译,因此在翻译时省略了这个词。如果需要保留“said”,可以在括号中标注原文,如下所示:우리는 전자 데이터 수집, 분석 및 검색(EDGAR) 시스템에 업로드된 재무 보고서를 기반으로 하는 새로운 데이터셋인 KPI-EDGAR를 소개합니다. 이 데이터셋의 주요 목표는 재무 문서에서 주요 성과 지표(KPIs)를 추출하고 이를 숫자 값과 다른 속성들에 연결하는 것입니다. 또한, 잠재적인 향후 연구를 위한 벤치마킹을 위해 동반되는 네 가지 기준 모델을 제공합니다. 더불어, 이 영역에서 관계의 엔티티 쌍이 본질적으로 모호한 경계를 더 잘 모델링하기 위해 기존의 F1 점수에 단어 수준 가중치 방식을 통합하여 said(말한) 추출 과정의 성공률을 측정하는 새로운 방법을 제안합니다.