HyperAIHyperAI

Command Palette

Search for a command to run...

CoVA: Kontextsensitive visuelle Aufmerksamkeit für die Informationsextraktion von Webseiten

Anurendra Kumar* [email protected] Keval Morabia* [email protected] Jingjin Wang [email protected] Kevin Chen-Chuan Chang [email protected] Alexander Schwing [email protected]

Zusammenfassung

Die Extraktion von Webseiteninformationen (WIE) ist ein wichtiger Schritt zur Erstellung von Wissensbasen. Klassische WIE-Methoden nutzen dazu das Document Object Model (DOM)-Baum einer Website. Allerdings birgt die Verwendung des DOM-Baums erhebliche Herausforderungen, da Kontext und Erscheinungsbild in abstrakter Form kodiert sind. Um dieser Herausforderung zu begegnen, schlagen wir vor, WIE als kontextsensitive Webseitenobjekterkennungsaufgabe zu reformulieren. Insbesondere entwickeln wir einen kontextsensitiven visuellen Aufmerksamkeitsbasierten (CoVA) Erkennungsprozess, der Erscheinungsmerkmale mit der syntaxischen Struktur des DOM-Baums kombiniert. Um den Ansatz zu untersuchen, sammeln wir einen neuen groß angelegten Datensatz von E-Commerce-Webseiten, für die wir jedes Webelement manuell mit vier Etiketten versehen: Produktpreis, Produkttitel, Produktbild und Hintergrund. Anhand dieses Datensatzes zeigen wir, dass der vorgeschlagene CoVA-Ansatz eine neue anspruchsvolle Referenzlinie darstellt, die die bisherigen Stand-of-the-Art-Methoden verbessert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CoVA: Kontextsensitive visuelle Aufmerksamkeit für die Informationsextraktion von Webseiten | Paper | HyperAI