Représentation de documents sensible aux labels par attention hybride pour la classification textuelle multi-label extrême

La classification extrême de texte à multiples étiquettes (XMTC) vise à associer les étiquettes les plus pertinentes d'un ensemble d'étiquettes de très grande échelle à un document. Il s'agit d'un problème particulièrement ardu, notamment pour les étiquettes de la queue de distribution, car il n'existe que peu de documents d'entraînement pour construire le classifieur. Le présent article est motivé par l'objectif d'explorer davantage la relation sémantique entre chaque document et les étiquettes extrêmes en tirant parti du contenu des documents et de la corrélation des étiquettes. Notre objectif est d'établir une représentation explicite sensible aux étiquettes pour chaque document à l'aide d'un modèle hybride de réseau neuronal profond avec mécanisme d'attention (LAHA). LAHA se compose de trois parties. La première partie utilise un mécanisme d'auto-attention à multiples étiquettes pour détecter la contribution de chaque mot aux étiquettes. La deuxième partie exploite la structure des étiquettes et le contenu des documents pour déterminer la connexion sémantique entre les mots et les étiquettes dans le même espace latent. Une stratégie de fusion adaptative est conçue dans la troisième partie pour obtenir la représentation finale du document sensible aux étiquettes, permettant ainsi une intégration suffisante des apports des deux premières parties. De nombreuses expériences ont été menées sur six jeux de données de référence en comparaison avec les méthodes les plus avancées actuellement disponibles. Les résultats montrent la supériorité de notre méthode LAHA proposée, en particulier pour les étiquettes de la queue de distribution.