HyperAIHyperAI
il y a 11 jours

Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques

{Christian Bizer, Dominique Ritze}
Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques
Résumé

Les tableaux HTML relationnels présents sur le Web contiennent des données décrivant une multitude d'entités et couvrant une large gamme de sujets. En conséquence, les tableaux web s'avèrent particulièrement utiles pour compléter les valeurs manquantes dans des bases de connaissances interdomaines telles que DBpedia, YAGO ou le Google Knowledge Graph. Avant que les données issues des tableaux web puissent être utilisées à cette fin, il est nécessaire de les associer à la base de connaissances concernée. Ce processus implique trois tâches d'appariement : l'appariement tableau-vers-classe, l'appariement ligne-vers-instance, et l'appariement attribut-vers-propriété. Des approches variées ont été proposées pour chacune de ces tâches. Toutefois, les approches existantes sont évaluées à l'aide de corpus de tableaux web différents, et chaque méthode individuelle exploite uniquement un sous-ensemble des caractéristiques des tableaux web et des bases de connaissances qui pourraient potentiellement aider aux tâches d'appariement. Ces deux limites rendent difficile la comparaison entre les différentes approches et l'évaluation de l'impact de chaque caractéristique sur les résultats globaux d'appariement. Ce papier contribue à une meilleure compréhension de l'utilité des différentes caractéristiques pour l'appariement tableau web vers base de connaissances en réimplémentant, dans un cadre d'appariement unique, diverses techniques d'appariement ainsi que des méthodes d'agrégation de scores de similarité issues de la littérature, puis en évaluant différentes combinaisons de ces techniques par rapport à une même référence d'or. Cette référence d'or est constituée d'alignements entre classes, instances et propriétés établis entre la base de connaissances DBpedia et des tableaux web provenant du corpus Web Data Commons.

Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques | Articles de recherche récents | HyperAI