Command Palette
Search for a command to run...
HDLTex : Apprentissage profond hiérarchique pour la classification de texte
HDLTex : Apprentissage profond hiérarchique pour la classification de texte
Kamran Kowsari* Donald E. Brown§‡ Mojtaba Heidarysafa§ Kiana Jafari Meimandi§ Matthew S. Gerber§‡ Laura E. Barnes§‡
Résumé
Le nombre croissant de documents produits chaque année nécessite des méthodes d' Traitement de l'Information de plus en plus performantes pour la recherche, la récupération et l'organisation du texte. Au cœur de ces méthodes se trouve la classification des documents, qui est devenue une application importante de l'apprentissage supervisé. Récemment, les performances de ces classifieurs traditionnels ont diminué avec l'augmentation du nombre de documents. Cela est dû au fait que cette augmentation du nombre de documents s'est accompagnée d'une augmentation du nombre de catégories. Ce papier aborde ce problème différemment des méthodes actuelles de classification des documents qui le considèrent comme un problème de classification multiclasse. Nous effectuons plutôt une classification hiérarchique en utilisant une approche que nous appelons Apprentissage Profond Hiérarchique pour la Classification du Texte (HDLTex). HDLTex utilise des piles d'architectures d'apprentissage profond pour fournir une compréhension spécialisée à chaque niveau de la hiérarchie documentaire.