Spaltentypannotierung
Column Type Annotation (CTA) ist eine Unterabgabe der Tabellenannotierung, die das Ziel verfolgt, den semantischen Typ einer Spalte in einer Tabelle vorherzusagen. Diese Aufgabe besteht darin, passende semantische Labels für Tabellenspalten aus Vokabularen wie DBpedia, Schema.org oder WikiData auszuwählen. CTA kann als ein Multi-Class-Klassifikationsproblem behandelt werden, bei dem nur ein semantischer Typ pro Spalte annotiert wird, oder als ein Multi-Label-Klassifikationsproblem, das es erlaubt, einer Spalte mehrere semantische Typen zuzuweisen. Diese Aufgabe hat erheblichen Anwendungswert für die Verbesserung des Datenverständnisses, die Förderung der Informationsabruf und die Stärkung der Wissensgraphenkonstruktion.