Marqueur lévitant compact pour l'extraction d'entités et de relations

Les travaux récents sur l'extraction d'entités et de relations se concentrent sur l'étude de la manière d'obtenir une meilleure représentation des segments à partir d'un encodeur pré-entraîné. Toutefois, une limitation majeure des approches existantes réside dans le fait qu'elles négligent les relations inter-ségments (paires). Dans ce travail, nous proposons une nouvelle méthode de représentation des segments, nommée Packed Levitated Markers (PL-Marker), qui prend en compte les relations inter-ségments en plaçant stratégiquement des marqueurs dans l'encodeur. Plus précisément, nous introduisons une stratégie de packing orientée vers le voisinage, qui considère de manière intégrée les segments voisins afin de mieux modéliser les informations relatives aux limites des entités. Par ailleurs, pour les tâches plus complexes de classification de paires de segments, nous concevons une stratégie de packing orientée vers le sujet, qui regroupe chaque sujet avec tous ses objets afin de modéliser efficacement les relations entre les paires de segments ayant le même sujet. Les résultats expérimentaux montrent que, grâce à l'amélioration des caractéristiques des marqueurs, notre modèle surpasser les modèles de référence sur six benchmarks d'identification nommée (NER), et obtient une amélioration de 4,1 % à 4,3 % en F1 strict pour les relations sur ACE04 et ACE05, tout en étant plus rapide que les modèles d'état de l'art précédents.