HyperAIHyperAI

Command Palette

Search for a command to run...

Tiefen Neuronale Netze für die Informationsextraktion aus Webseiten

and Jan Sedivy Hubacek Ondrej Tomas Gogar

Zusammenfassung

Web-Wrappers sind Systeme zur Extraktion strukturierter Informationen aus Webseiten. Derzeit müssen Wrappers an ein bestimmtes Website-Template angepasst werden, bevor sie mit dem Extraktionsprozess beginnen können. In dieser Arbeit präsentieren wir eine neue Methode, die konvolutionale neuronale Netze nutzt, um einen Wrapper zu lernen, der Informationen auch aus bisher nicht gesehenen Template-Strukturen extrahieren kann. Dadurch benötigt dieser Wrapper keine site-spezifische Initialisierung und ist in der Lage, Informationen aus einer einzigen Webseite zu extrahieren. Außerdem schlagen wir eine Methode zur räumlichen Textkodierung vor, die es ermöglicht, sowohl visuelle als auch textuelle Inhalte einer Webseite in ein einziges neuronales Netz zu kodieren. Erste Experimente zur Extraktion von Produktdaten zeigten sehr vielversprechende Ergebnisse und deuten darauf hin, dass dieser Ansatz zu einem allgemeinen, site-unabhängigen Web-Wrapper führen kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp