HyperAIHyperAI
vor 2 Monaten

Semantische Annotationen für tabellarische Daten lernen

Jiaoyan Chen; Ernesto Jimenez-Ruiz; Ian Horrocks; Charles Sutton
Semantische Annotationen für tabellarische Daten lernen
Abstract

Die Nützlichkeit von tabellarischen Daten wie Webtabellen hängt entscheidend vom Verständnis ihrer Semantik ab. Diese Studie konzentriert sich auf die Vorhersage von Spaltentypen für Tabellen ohne Metadaten. Im Gegensatz zu traditionellen lexikalischen Matching-Methoden schlagen wir ein tiefes Vorhersagemodell vor, das die kontextuelle Semantik einer Tabelle vollständig nutzen kann, einschließlich lokaler Tabellenmerkmale, die durch ein Hybrides Neuronales Netzwerk (HNN) gelernt werden, und zwischen-Spalten-Semantikmerkmale, die durch einen Algorithmus zur Abfrage und Beantwortung in einer Wissensbasis (KB) gelernt werden. Es zeigt nicht nur gute Leistung bei einzelnen Tabellensätzen, sondern auch beim Transfer von einem Tabellensatz zu einem anderen.