Type de colonne Annotation
La Classification de Type de Colonne (CTA) est une sous-tâche d'annotation de table qui vise à prédire le type sémantique d'une colonne dans un tableau. Cette tâche consiste à sélectionner des étiquettes sémantiques appropriées pour les colonnes de tableaux à partir de vocabulaires tels que DBpedia, Schema.org ou WikiData. La CTA peut être traitée comme un problème de classification multiclasse, où seul un type sémantique est annoté pour chaque colonne, ou comme un problème de classification multietiquette, permettant à une colonne d'avoir plusieurs types sémantiques. Cette tâche présente une valeur d'application significative pour améliorer la compréhension des données, promouvoir la recherche d'information et renforcer la construction de graphes de connaissances.