DREIFLUSS: Ein minimalistischer Ansatz für die Tabellenübereinstimmung
{Alsayed Algergawy Vishvapalsinhji Parmar}

Abstract
Diese Arbeit stellt DREIFLUSS vor, einen innovativen und minimalistischen Ansatz, der darauf abzielt, die Aufgaben der Spalten-Typ-Annotation (Column Type Annotation, CTA) und der Spalten-Eigenschafts-Annotation (Column Property Annotation, CPA) im SemTab-Wettbewerb zu lösen. DREIFLUSS nutzt effizient semantische Informationen aus etablierten Wissensgraphen, nämlich DBpedia und Schema.org, um den Annotierungsprozess zu verbessern. Experimentelle Ergebnisse belegen die überlegene Leistung von Logistik-Regression-Modellen, die mittels DREIFLUSS trainiert wurden, was präzise Spalten-Typ-Annotationen sowie bedeutungsvolle Beziehungsvorhersagen ermöglicht. Die Ergebnisse unterstreichen die Bedeutung einer geeigneten Stichprobentechnik beim Modelltraining und zeigen, wie dies die Genauigkeit und Effizienz der Tabellenübereinstimmung erhöht. Diese Forschung eröffnet einen vielversprechenden Weg zur Verbesserung von Tabellenübereinstimmungstechniken und betont die praktischen Implikationen von DREIFLUSS für Aufgaben der Datenintegration und Wissensentdeckung.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| column-type-annotation-on-wdc-sotab-v2 | DREIFLUSS | Micro F1: 38.04 |
| columns-property-annotation-on-wdc-sotab-v2 | DREIFLUSS | Micro F1: 17.39 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.