Typage d'entités à granularité fine par raisonnement sur les étiquettes

Les approches conventionnelles d'identification des entités s'appuient sur des paradigmes de classification indépendants, ce qui les rend peu efficaces pour reconnaître des types d'entités interdépendants, rares ou très fins. Dans cet article, nous soutenons que les dépendances intrinsèques et extrinsèques implicites entre les étiquettes peuvent fournir des connaissances cruciales pour relever ces défis. À cette fin, nous proposons \emph{Label Reasoning Network (LRN)}, un modèle qui reasonne séquentiellement sur des étiquettes d'entités fines en découvrant et en exploitant les connaissances de dépendance entre étiquettes présentes dans les données. Plus précisément, LRN utilise un réseau auto-régressif pour effectuer un raisonnement déductif et un graphe d'attributs bipartite pour réaliser un raisonnement inductif entre étiquettes, permettant ainsi de modéliser, d'apprendre et de raisonner de manière efficace des dépendances complexes entre étiquettes de manière séquentielle et end-to-end, du type séquence vers ensemble. Les expériences montrent que LRN atteint des performances de pointe sur des benchmarks standards d'identification d'entités ultra-fines, tout en étant également capable de traiter efficacement le problème des étiquettes rares.