HyperAIHyperAI
il y a 9 jours

JenTab fait face aux nouveaux défis de SemTab 2021

{Sirko Schindler, Nora Abdelmageed}
JenTab fait face aux nouveaux défis de SemTab 2021
Résumé

Bien que les tableaux constituent une source riche d’informations structurées, leur utilisation automatisée est souvent entravée par l’ambiguïté inhérente qu’ils contiennent. Des problèmes allant des simples fautes de frappe aux conventions de nommage incohérentes, en passant par l’homonymie entre valeurs, constituent des obstacles substantiels à l’exploitation de cette source de connaissance. Bien que le Semantic Web puisse atténuer plusieurs de ces difficultés, le processus d’annotation lui-même reste complexe. Afin de stimuler de nouvelles idées et d’améliorer les approches existantes, le Semantic Web Challenge sur la correspondance entre données tabulaires et graphes de connaissances (SemTab), organisé depuis 2019, met en place chaque année des compétitions permettant aux systèmes de démontrer leurs capacités actuelles. Des jeux de données provenant de sources et de caractéristiques diverses mettent en lumière les différents défis présents dans ce domaine. Dans cet article, nous présentons l’évolution de notre système, « JenTab », au cours de SemTab2021. Nous avons révisé l’architecture du système, optimisé ses modules individuels et développé plusieurs pipelines ciblant des défis spécifiques rencontrés tout au long de la compétition. JenTab figure parmi les cinq meilleurs systèmes des deux premiers tours de SemTab2021. Les résultats démontrent la flexibilité de JenTab ainsi que sa capacité à s’adapter rapidement à de nouveaux défis.