HyperAIHyperAI
il y a 2 mois

Apprentissage d'annotations sémantiques pour les données tabulaires

Jiaoyan Chen; Ernesto Jimenez-Ruiz; Ian Horrocks; Charles Sutton
Apprentissage d'annotations sémantiques pour les données tabulaires
Résumé

L'utilité des données tabulaires, telles que les tableaux web, dépend de manière critique de la compréhension de leur sémantique. Cette étude se concentre sur la prédiction du type de colonne pour des tableaux ne comportant aucune métadonnée. Contrairement aux méthodes traditionnelles basées sur l'appariement lexicographique, nous proposons un modèle de prédiction profonde capable d'exploiter pleinement la sémantique contextuelle d'un tableau, y compris les caractéristiques locales apprises par un Réseau Neuronal Hybride (HNN) et les caractéristiques sémantiques inter-colonnes apprises par un algorithme de recherche dans une base de connaissances (KB) et de réponse à des requêtes. Ce modèle montre d'excellentes performances non seulement sur des ensembles individuels de tableaux, mais aussi lors du transfert d'un ensemble de tableaux à un autre.