vor 6 Monaten

Zusammenfassung

Bisherige Arbeiten zur Extraktion Schlüsselinformationen aus visuell reichen Dokumenten (Visually Rich Documents, VRDs) konzentrieren sich hauptsächlich auf die Beschriftung des Textes innerhalb jedes Bounding Boxes (d. h. semantischer Entitäten), während die zwischen den Entitäten bestehenden Beziehungen weitgehend unerforscht bleiben. In diesem Paper adaptieren wir den populären Abhängigkeitsanalyse-Modell, den Biaffinen Parser, für die Aufgabe der Entitäts-Beziehungs-Extraktion. Im Gegensatz zum ursprünglichen Abhängigkeitsanalyse-Modell, das Abhängigkeitsbeziehungen zwischen einzelnen Wörtern erkennt, identifizieren wir nun Beziehungen zwischen Wortgruppen unter Verwendung von Layout-Informationen. Wir haben verschiedene Darstellungsformen semantischer Entitäten, verschiedene VRD-Encoder und verschiedene Relation-Decoder verglichen. Die Ergebnisse zeigen, dass unser vorgeschlagener Modell auf dem FUNSD-Datensatz einen F1-Score von 65,96 % erreicht. Für den praktischen Einsatz wurde das Modell in der internen Zoll-Datenanwendung eingesetzt und erzielt dort zuverlässige Leistung im Produktivbetrieb.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Dokumentenverstehen

Natürliche Sprachverarbeitung

Multimodal

Natürliche Sprachverarbeitung

Multimodal

Aufgabe

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

Zusammenfassung

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Dokumentenverstehen

Natürliche Sprachverarbeitung

Multimodal

Natürliche Sprachverarbeitung

Multimodal

Aufgabe

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

Zusammenfassung

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Entitätsrelationsextraktion als Abhängigkeitsanalyse in visuell reichen Dokumenten

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Entitätsrelationsextraktion als Abhängigkeitsanalyse in visuell reichen Dokumenten

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Entitätsrelationsextraktion als Abhängigkeitsanalyse in visuell reichen Dokumenten

Yue Zhang Bo Zhang Rui Wang Junjie Cao Chen Li Zuyi Bao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters