HyperAIHyperAI

Command Palette

Search for a command to run...

Extraction hiérarchique de sujets par arbre sphérique conjoint et intégration textuelle

Yu Meng Yunyi Zhang Jiaxin Huang Yu Zhang Chao Zhang Jiawei Han

Résumé

Extraire un ensemble de sujets significatifs organisés en une hiérarchie est intuitivement attrayant, car les corrélations entre sujets sont fréquentes dans les grandes corpora de texte. Afin de tenir compte des structures hiérarchiques potentielles de sujets, les modèles hiérarchiques de sujets généralisent les modèles plats en intégrant des hiérarchies de sujets latentes dans leur processus de modélisation générative. Toutefois, en raison de leur nature purement non supervisée, la hiérarchie de sujets apprise s’écarte souvent des besoins ou centres d’intérêt spécifiques des utilisateurs. Pour guider le processus d’extraction hiérarchique de sujets avec une supervision utilisateur minimale, nous proposons une nouvelle tâche, appelée Extraction hiérarchique de sujets, qui prend en entrée un arbre de catégories décrit uniquement par des noms de catégories, et vise à extraire un ensemble de termes représentatifs pour chaque catégorie à partir d’un corpus de texte, afin d’aider l’utilisateur à mieux comprendre les sujets qui l’intéressent. Nous développons une nouvelle méthode conjointe d’embedding de l’arbre et du texte, accompagnée d’une procédure d’optimisation rigoureuse, permettant une modélisation simultanée de la structure de l’arbre de catégories et du processus génératif du corpus dans l’espace sphérique, afin d’extraire efficacement des termes représentatifs par catégorie. Nos expériences approfondies montrent que notre modèle, nommé JoSH, extrait un ensemble de sujets hiérarchiques de haute qualité avec une grande efficacité, et apporte un bénéfice significatif aux tâches de classification textuelle hiérarchique faiblement supervisée.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp