HyperAIHyperAI
il y a 16 jours

Clustering hiérarchique contrastif

Michał Znaleźniak, Przemysław Rola, Patryk Kaszuba, Jacek Tabor, Marek Śmieja
Clustering hiérarchique contrastif
Résumé

Le clustering profond a longtemps été dominé par des modèles plats, qui divisent un ensemble de données en un nombre prédéfini de groupes. Bien que les méthodes récentes atteignent une similarité extrêmement élevée avec les vérités terrain sur des benchmarks populaires, l'information contenue dans une partition plate reste limitée. Dans cet article, nous introduisons CoHiClust, un modèle de clustering hiérarchique contrastif basé sur des réseaux neuronaux profonds, applicable aux données d’image typiques. En exploitant une approche d’apprentissage auto-supervisé, CoHiClust extrait un réseau de base en un arbre binaire sans accès à aucune donnée étiquetée. La structure de clustering hiérarchique ainsi obtenue permet d’analyser les relations entre les clusters, ainsi que de mesurer la similarité entre les points de données. Les expérimentations démontrent que CoHiClust génère une structure de clusters raisonnable, conforme à notre intuition et aux sémantiques des images. En outre, il obtient une précision de clustering supérieure sur la plupart des jeux de données d’images par rapport aux modèles de clustering plats les plus avancés de l’état de l’art.

Clustering hiérarchique contrastif | Articles de recherche récents | HyperAI