HyperAIHyperAI
vor 2 Monaten

Doc2Graph: Ein task-agnostisches Dokumentverstehensframework basierend auf Graph-Neuralen Netzen

Andrea Gemelli; Sanket Biswas; Enrico Civitelli; Josep Lladós; Simone Marinai
Doc2Graph: Ein task-agnostisches Dokumentverstehensframework basierend auf Graph-Neuralen Netzen
Abstract

Geometrisches Deep Learning hat in letzter Zeit erhebliches Interesse in einem breiten Spektrum von Maschinelles-Lernen-Feldern, einschließlich der Dokumentanalyse, geweckt. Die Anwendung von Graph Neural Networks (GNNs) ist in verschiedenen dokumentspezifischen Aufgaben entscheidend geworden, da sie wichtige strukturelle Muster aufdecken können, die für Schlüsselinformationsextraktionsprozesse grundlegend sind. Frühere Arbeiten in der Literatur schlagen aufgabenorientierte Modelle vor und berücksichtigen nicht die volle Leistungsfähigkeit von Graphen. Wir präsentieren Doc2Graph, ein aufgabenunabhängiges Dokumentverstehensframework basierend auf einem GNN-Modell, das verschiedene Aufgaben bei unterschiedlichen Dokumenttypen lösen kann. Unser Ansatz wurde an zwei anspruchsvollen Datensätzen zur Schlüsselinformationsextraktion im Formularverstehen, Rechnungslayoutsanalyse und Tabellenerkennung evaluiert. Unser Code ist frei zugänglich unter https://github.com/andreagemelli/doc2graph.

Doc2Graph: Ein task-agnostisches Dokumentverstehensframework basierend auf Graph-Neuralen Netzen | Neueste Forschungsarbeiten | HyperAI