Étiquetage Supérieur Prenant en Compte la Géométrie avec Convolutions Dynamiques Hétérogènes

Les catégories syntaxiques des formalismes de grammaire catégorielle sont des unités structurées composées de primitives plus petites et indivisibles, liées entre elles par les règles de formation des catégories sous-jacentes à la grammaire. Dans l'approche actuelle du supertagging constructif, les modèles neuronaux sont de plus en plus sensibilisés à la structure interne des catégories, ce qui leur permet de prédire de manière plus fiable les catégories rares et hors vocabulaire, avec des implications significatives pour les grammaires auparavant considérées comme trop complexes pour être utilisées pratiquement. Dans cette étude, nous réexaminons le supertagging constructif sous un angle théorique des graphes, et proposons un cadre basé sur des convolutions dynamiques hétérogènes visant à exploiter la structure distinctive de l'espace de sortie d'un supertagger. Nous testons notre approche sur plusieurs jeux de données de grammaire catégorielle couvrant différentes langues et formalismes grammaticaux, obtenant ainsi des améliorations substantielles par rapport aux scores précédents de l'état de l'art. Le code sera mis à disposition sur https://github.com/konstantinosKokos/dynamic-graph-supertagging.