DAGOBAH: Tabellen- und Graphenkontexte für eine effiziente semantische Annotation tabellarischer Daten
{Raphaël Troncy Pierre Monnin Thomas Labbé Frédéric Deuzé Yoan Chabot Jixiong Liu Viet-Phi Huynh}

Abstract
In diesem Beitrag präsentieren wir die neuesten Verbesserungen des DAGOBAH-Systems, das eine automatische Vorverarbeitung und semantische Interpretation von Tabellen durchführt. Insbesondere berichten wir über vielversprechende Ergebnisse, die im Rahmen der SemTab 2021-Challenge erzielt wurden, dank Optimierungen der Suchmechanismen und neuer Techniken zur Analyse des Kontexts von Knoten im Ziel-Wissensgraphen. Zudem stellen wir die Implementierung der DAGOBAH-Algorithmen innerhalb des Unternehmens Orange mittels der TableAnnotation-API sowie einer frontend-basierten Benutzeroberfläche vor. Diese beiden Zugriffsmethoden ermöglichen eine beschleunigte Einführung von Lösungen zur semantischen Tabelleninterpretation im Unternehmen, um industrielle Anforderungen effizient zu erfüllen.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| cell-entity-annotation-on-biodivtab | DAGOBAH | F1 (%): 62 |
| cell-entity-annotation-on-toughtables-dbp | DAGOBAH | F1 (%): 94.5 |
| cell-entity-annotation-on-toughtables-wd | DAGOBAH | F1 (%): 92.3 |
| column-type-annotation-on-biodivtab | DAGOBAH | F1 (%): 34.4 |
| column-type-annotation-on-gittables-semtab | DAGOBAH | F1 (%): 7.00 |
| column-type-annotation-on-gittables-semtab-1 | DAGOBAH | F1 (%): 18.3 |
| column-type-annotation-on-toughtables-dbp | DAGOBAH | F1 (%): 42.2 |
| column-type-annotation-on-toughtables-wd | DAGOBAH | F1 (%): 83.2 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.