Semantische Annotation tabellarischer Daten für maschinenübergreifende Interoperabilität mittels neuro-symbolischer Ankchoring
{Remzi Celebi Shervin Mehryar}

Abstract
In diesem Paper untersuchen wir die automatisierte Annotation tabellarischer Daten unter Verwendung semantischer Technologien in Kombination mit neuronalen Netzwerk-Embeddings. Speziell schlagen wir ein Anchoring-Modell vor, bei dem Eigenschafts- und Zelltypen aus dem Daten-Embedding-Raum mit Ontologie-Relationen und Entitätstypen ausgerichtet werden. Wir zeigen, dass durch die Kombination der Stärken symbolischer Schlussfolgerung, neuronaler Embeddings und gezielter Verlustfunktionsgestaltung eine erhebliche Leistungssteigerung erzielt werden kann: Bis zu 86 % Genauigkeit bei der Spalten-Eigenschafts-Annotation, 82 % bei der Spalten-Typ-Annotation und 87 % bei der Spalten-Qualifier-Annotation basierend auf Extraktionen aus DBpedia und Wikidata.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| column-type-annotation-on-wdc-sotab-v2 | MUT2KG | Micro F1: 32.01 |
| columns-property-annotation-on-wdc-sotab-v2 | MUT2KG | Micro F1: 79.35 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.