HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques

{Christian Bizer Dominique Ritze}

Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques

Résumé

Les tableaux HTML relationnels présents sur le Web contiennent des données décrivant une multitude d'entités et couvrant une large gamme de sujets. En conséquence, les tableaux web s'avèrent particulièrement utiles pour compléter les valeurs manquantes dans des bases de connaissances interdomaines telles que DBpedia, YAGO ou le Google Knowledge Graph. Avant que les données issues des tableaux web puissent être utilisées à cette fin, il est nécessaire de les associer à la base de connaissances concernée. Ce processus implique trois tâches d'appariement : l'appariement tableau-vers-classe, l'appariement ligne-vers-instance, et l'appariement attribut-vers-propriété. Des approches variées ont été proposées pour chacune de ces tâches. Toutefois, les approches existantes sont évaluées à l'aide de corpus de tableaux web différents, et chaque méthode individuelle exploite uniquement un sous-ensemble des caractéristiques des tableaux web et des bases de connaissances qui pourraient potentiellement aider aux tâches d'appariement. Ces deux limites rendent difficile la comparaison entre les différentes approches et l'évaluation de l'impact de chaque caractéristique sur les résultats globaux d'appariement. Ce papier contribue à une meilleure compréhension de l'utilité des différentes caractéristiques pour l'appariement tableau web vers base de connaissances en réimplémentant, dans un cadre d'appariement unique, diverses techniques d'appariement ainsi que des méthodes d'agrégation de scores de similarité issues de la littérature, puis en évaluant différentes combinaisons de ces techniques par rapport à une même référence d'or. Cette référence d'or est constituée d'alignements entre classes, instances et propriétés établis entre la base de connaissances DBpedia et des tableaux web provenant du corpus Web Data Commons.

Benchmarks

BenchmarkMéthodologieMétriques
columns-property-annotation-on-t2dv2T2K
F1 (%): 81
row-annotation-on-t2dv2T2K
F1 (%): 80
table-type-detection-on-t2dv2T2K
F1 (%): 92

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Correspondance de tables web à DBpedia – Une étude sur l'utilité des caractéristiques | Articles de recherche | HyperAI