HyperAIHyperAI
vor 11 Tagen

Zuordnung von Web-Tabellen zu DBpedia – Eine Studie zur Merkmalsnutzenanalyse

{Christian Bizer, Dominique Ritze}
Zuordnung von Web-Tabellen zu DBpedia – Eine Studie zur Merkmalsnutzenanalyse
Abstract

Relationale HTML-Tabellen im Web enthalten Daten, die eine Vielzahl von Entitäten beschreiben und ein breites Spektrum an Themen abdecken. Daher sind Web-Tabellen äußerst nützlich, um fehlende Werte in querschnittlichen Wissensbasen wie DBpedia, YAGO oder dem Google Knowledge Graph zu ergänzen. Bevor Web-Tabellendaten zur Auffüllung fehlender Werte genutzt werden können, müssen die Tabellen zunächst mit der jeweiligen Wissensbasis abgeglichen werden. Dies erfordert drei Arten von Abgleichaufgaben: Tabellen-zu-Klasse-Abgleich, Zeile-zu-Instanz-Abgleich sowie Attribut-zu-Eigenschafts-Abgleich. Für jede dieser Aufgaben wurden verschiedene Abgleichansätze vorgeschlagen. Leider werden die bestehenden Ansätze jeweils an unterschiedlichen Web-Tabellen-Korpora evaluiert, und jeder einzelne Ansatz nutzt lediglich einen Teil der potenziell hilfreichen Merkmale aus Web-Tabellen und Wissensbasen. Diese beiden Einschränkungen erschweren den Vergleich der verschiedenen Abgleichansätze sowie die Beurteilung des Einflusses einzelner Merkmale auf die Gesamtergebnisse des Abgleichs. Dieser Artikel trägt dazu bei, das Verständnis der Nutzbarkeit verschiedener Merkmale für den Abgleich von Web-Tabellen mit Wissensbasen zu verbessern, indem verschiedene Abgleichtechniken sowie Methoden zur Aggregation von Ähnlichkeitswerten aus der Literatur innerhalb eines einheitlichen Abgleichframeworks nachimplementiert und verschiedene Kombinationen dieser Techniken anhand eines einzigen Gold-Standard evaluiert werden. Der Gold-Standard besteht aus Korrespondenzen zwischen Klassen, Instanzen und Eigenschaften der DBpedia-Wissensbasis und Web-Tabellen aus dem Web Data Commons-Web-Tabellen-Korpus.

Zuordnung von Web-Tabellen zu DBpedia – Eine Studie zur Merkmalsnutzenanalyse | Neueste Forschungsarbeiten | HyperAI