ImpactCite : Une méthode basée sur XLNet pour l'analyse de l'impact des citations

Les citations jouent un rôle crucial dans la compréhension de l'impact de la littérature scientifique. Généralement, les citations sont analysées de manière quantitative, tandis qu'une analyse qualitative des citations peut révéler des insights plus profonds sur l'impact d'un artefact scientifique au sein de la communauté. Par conséquent, l'analyse de l'impact des citations (qui inclut la classification du sentiment et de l'intention) nous permet de quantifier la qualité des citations, ce qui peut finalement nous aider à estimer le classement et l'impact. La contribution de cet article est double. Premièrement, nous évaluons les modèles linguistiques bien connus tels que BERT et ALBERT, ainsi que plusieurs réseaux populaires pour les tâches de classification du sentiment et de l'intention. Deuxièmement, nous proposons ImpactCite, une méthode basée sur XLNet pour l'analyse de l'impact des citations. Toutes les évaluations ont été réalisées sur un ensemble de jeux de données publics d'analyse des citations. Les résultats d'évaluation montrent qu'ImpactCite atteint une nouvelle performance state-of-the-art pour la classification de l'intention et du sentiment des citations en surpassant les approches existantes respectivement de 3,44 % et 1,33 % en termes de score F1. Nous soulignons donc l'utilisation d'ImpactCite (solution basée sur XLNet) pour les deux tâches afin de mieux comprendre l'impact d'une citation. Des efforts supplémentaires ont été déployés pour élaborer le corpus CSC-Clean, qui constitue un ensemble de données propre et fiable pour la classification du sentiment des citations.