HyperAIHyperAI
il y a 2 mois

Classification hiérarchique du texte avec assignation de labels renforcée

Yuning Mao; Jingjing Tian; Jiawei Han; Xiang Ren
Classification hiérarchique du texte avec assignation de labels renforcée
Résumé

Alors que les méthodes de classification textuelle hiérarchique (CTH) existantes tentent de capturer les hiérarchies d'étiquettes pour l'entraînement des modèles, elles prennent soit des décisions locales concernant chaque étiquette, soit ignorent complètement les informations hiérarchiques lors de l'inférence. Pour résoudre le décalage entre l'entraînement et l'inférence ainsi que pour modéliser les dépendances entre les étiquettes de manière plus rigoureuse, nous formulons la CTH comme un processus décisionnel de Markov et proposons d'apprendre une politique d'affectation d'étiquettes via l'apprentissage profond par renforcement afin de déterminer où placer un objet et quand arrêter le processus d'affectation. La méthode proposée, HiLAP, explore la hiérarchie de manière cohérente à la fois pendant l'entraînement et l'inférence, et prend des décisions interdépendantes. En tant que cadre général, HiLAP peut intégrer différents encodeurs neuronaux en tant que modèles de base pour un entraînement end-to-end. Les expériences menées sur cinq jeux de données publics et quatre modèles de base montrent que HiLAP offre une amélioration moyenne de 33,4 % en termes de Macro-F1 par rapport aux classifieurs plats et surpassent largement les méthodes CTH les plus avancées actuellement disponibles. Les données et le code sont disponibles à l'adresse suivante : https://github.com/morningmoni/HiLAP.

Classification hiérarchique du texte avec assignation de labels renforcée | Articles de recherche récents | HyperAI