HyperAIHyperAI
il y a 2 mois

KPI-EDGAR : Un nouveau jeu de données et une métrique associée pour l’extraction de relations à partir de documents financiers

Tobias Deußer; Syed Musharraf Ali; Lars Hillebrand; Desiana Nurchalifah; Basil Jacob; Christian Bauckhage; Rafet Sifa
KPI-EDGAR : Un nouveau jeu de données et une métrique associée pour l’extraction de relations à partir de documents financiers
Résumé

Nous présentons KPI-EDGAR, un nouveau jeu de données pour la Reconnaissance et l'Extraction conjointes d'Entités Nommées et de Relations, basé sur des rapports financiers téléversés dans le système Electronique de Collecte, d'Analyse et de Récupération de Données (EDGAR). L'objectif principal est d'extraire les Indicateurs Clés de Performance (KPIs) des documents financiers et de les relier à leurs valeurs numériques et autres attributs. Nous fournissons également quatre modèles de référence accompagnant ce jeu de données pour servir de base de comparaison aux recherches futures potentielles. De plus, nous proposons une nouvelle méthode pour évaluer le succès du processus d'extraction en intégrant un schéma de pondération au niveau des mots dans le score F1 conventionnel, afin de mieux modéliser les frontières floues inhérentes aux paires d'entités dans ce domaine.

KPI-EDGAR : Un nouveau jeu de données et une métrique associée pour l’extraction de relations à partir de documents financiers | Articles de recherche récents | HyperAI