HyperAIHyperAI

Command Palette

Search for a command to run...

PEneo: Vereinheitlichung der Linienextraktion, Liniengruppierung und Entitätsverknüpfung für die End-to-End-Dokumentenpaarextraktion

Zening Lin Jiapeng Wang Teng Li Wenhui Liao Dayi Huang Longfei Xiong Lianwen Jin

Zusammenfassung

Die Extraktion von Dokumentenpaaren zielt darauf ab, Schlüssel- und Wertentitäten sowie ihre Beziehungen aus visuell reichhaltigen Dokumenten zu identifizieren. Die meisten existierenden Methoden teilen diesen Prozess in zwei getrennte Aufgaben auf: die semantische Entitätserkennung (SER) und die Beziehungsextraktion (RE). Allerdings kann die einfache Hintereinanderausführung von SER und RE zu schwerwiegenden Fehlervorträgen führen und schlägt bei Fällen wie mehrzeilige Entitäten in realistischen Szenarien fehl. Um diese Probleme zu lösen, stellt dieses Papier einen neuen Framework namens PEneo (Pair Extraction new decoder option) vor, der die Dokumentenpaarextraktion in einem einheitlichen Pipeline durchführt und dabei drei gleichzeitig laufende Unterprozesse integriert: Zeilenextraktion, Zeilengruppierung und Entitätsverknüpfung. Dieser Ansatz verringert das Problem der Fehlerakkumulation und kann den Fall mehrzeiliger Entitäten bewältigen. Darüber hinaus, um die Leistung des Modells besser zu evaluieren und zukünftige Forschungen zur Paarextraktion zu erleichtern, stellen wir RFUND vor, eine neu annotierte Version der häufig verwendeten FUNSD- und XFUND-Datensätze, um deren Genauigkeit zu erhöhen und realistische Situationen abzudecken. Experimente an verschiedenen Benchmarks zeigen PEneos Überlegenheit gegenüber früheren Pipelines, wobei es bei Kombination mit verschiedenen Backbones wie LiLT und LayoutLMv3 eine erhebliche Leistungssteigerung erreicht (z.B. 19,89%-22,91% F1-Score auf RFUND-EN), was seine Effektivität und Allgemeingültigkeit unterstreicht. Der Code und die neuen Annotationen sind unter https://github.com/ZeningLin/PEneo verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
PEneo: Vereinheitlichung der Linienextraktion, Liniengruppierung und Entitätsverknüpfung für die End-to-End-Dokumentenpaarextraktion | Paper | HyperAI