HyperAIHyperAI
il y a 2 mois

Doc2Graph : un cadre de compréhension des documents indépendant des tâches basé sur les réseaux neuronaux graphiques

Andrea Gemelli; Sanket Biswas; Enrico Civitelli; Josep Lladós; Simone Marinai
Doc2Graph : un cadre de compréhension des documents indépendant des tâches basé sur les réseaux neuronaux graphiques
Résumé

L'apprentissage profond géométrique a récemment suscité un intérêt considérable dans de nombreux domaines de l'apprentissage automatique, notamment l'analyse de documents. L'application des réseaux neuronaux graphiques (GNNs) est devenue cruciale pour diverses tâches liées aux documents, car elle permet de dévoiler des motifs structuraux importants, fondamentaux dans les processus d'extraction d'informations clés. Les travaux précédents dans la littérature proposent des modèles orientés vers des tâches spécifiques et ne prennent pas pleinement en compte le potentiel des graphes. Nous présentons Doc2Graph, un cadre d'interprétation de documents indépendant des tâches, basé sur un modèle GNN, capable de résoudre différentes tâches à partir de différents types de documents. Nous avons évalué notre approche sur deux jeux de données complexes pour l'extraction d'informations clés dans l'interprétation des formulaires, l'analyse du layout des factures et la détection des tables. Notre code est librement accessible sur https://github.com/andreagemelli/doc2graph.

Doc2Graph : un cadre de compréhension des documents indépendant des tâches basé sur les réseaux neuronaux graphiques | Articles de recherche récents | HyperAI