HyperAIHyperAI

Command Palette

Search for a command to run...

Regroupement profond avec propagation de mesure

Minhua Chen Badrinath Jayakumar Padmasundari Gopalakrishnan Qiming Huang Michael Johnston Patrick Haffner

Résumé

Les modèles profonds ont amélioré l'état de l'art pour l'apprentissage supervisé et non supervisé. Par exemple, le clustering profond intégré (DEC) a considérablement amélioré les performances du clustering non supervisé en utilisant des autoencodeurs empilés pour l'apprentissage de représentation. Cependant, une faiblesse des modèles profonds est que la structure de voisinage locale dans l'espace d'origine n'est pas nécessairement préservée dans l'espace latent. Pour préserver la géométrie locale, diverses méthodes ont été proposées dans la littérature sur l'apprentissage supervisé et semi-supervisé (par exemple, le clustering spectral et la propagation de labels) en utilisant une régularisation par laplacien de graphe. Dans cet article, nous combinons la force de l'apprentissage de représentation profonde avec la propagation de mesure (MP), une méthode de régularisation graphique basée sur la divergence KL initialement utilisée dans le scénario semi-supervisé. L'hypothèse principale de MP est que si deux points de données sont proches dans l'espace d'origine, ils sont susceptibles d'appartenir à la même classe, mesurée par la divergence KL de la distribution d'appartenance à une classe. En adoptant cette hypothèse dans le contexte d'apprentissage non supervisé, nous proposons notre modèle Deep Embedded Clustering Aided by Measure Propagation (DECAMP). Nous évaluons DECAMP sur des tâches de clustering de textes courts. Sur trois jeux de données publics, DECAMP se distingue favorablement par rapport aux autres méthodes d'avant-garde, y compris celles qui utilisent des données supplémentaires pour générer des plongements lexicaux utilisés dans le processus de clustering. Par exemple, sur le jeu de données Stackoverflow, DECAMP a atteint une précision de clustering de 79 %, soit environ 5 % supérieure à toutes les méthodes existantes. Ces résultats empiriques suggèrent que DECAMP est une méthode très efficace pour l'apprentissage non supervisé.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp