HyperAIHyperAI
il y a 2 mois

DeepDPM : Regroupement profond avec un nombre de clusters inconnu

Meitar Ronen; Shahaf E. Finder; Oren Freifeld
DeepDPM : Regroupement profond avec un nombre de clusters inconnu
Résumé

L'apprentissage profond (DL) a montré un grand potentiel dans la tâche non supervisée de clustering. Cependant, alors que les avantages de l'approche non paramétrique sont bien connus dans le clustering classique (c'est-à-dire non profond), la plupart des méthodes de clustering profond sont paramétriques : elles nécessitent un nombre de clusters prédéfini et fixe, noté K. Lorsque K est inconnu, l'utilisation de critères de sélection de modèle pour choisir sa valeur optimale peut devenir coûteuse en termes de calculs, particulièrement en DL où le processus d'entraînement devrait être répété plusieurs fois. Dans cette étude, nous comblons cet écart en introduisant une méthode efficace de clustering profond qui ne nécessite pas de connaître la valeur de K car elle l'infère au cours de l'apprentissage. En utilisant un cadre de division/fusion, une architecture dynamique s'adaptant aux variations de K, et une nouvelle fonction de perte, notre méthode proposée surpasse les méthodes non paramétriques existantes (classiques et profondes). Alors que les rares méthodes non paramétriques profondes existantes manquent d'évolutivité, nous démontrons celle de notre méthode en étant les premiers à rapporter ses performances sur ImageNet. Nous montrons également l'importance d'inférer K en démontrant comment les performances des méthodes qui fixent K se détériorent lorsque leur valeur supposée s'éloigne davantage de la valeur réelle, en particulier sur des jeux de données déséquilibrés. Notre code est disponible à l'adresse suivante : https://github.com/BGU-CS-VIL/DeepDPM.

DeepDPM : Regroupement profond avec un nombre de clusters inconnu | Articles de recherche récents | HyperAI