HyperAIHyperAI
il y a 2 mois

SPICE : Étiquetage Sémantique Pseudo pour le Regroupement d'Images

Chuang Niu; Hongming Shan; Ge Wang
SPICE : Étiquetage Sémantique Pseudo pour le Regroupement d'Images
Résumé

La similarité entre les échantillons et la discordance entre les clusters sont deux aspects cruciaux du regroupement d'images. Cependant, les méthodes actuelles de clustering profond souffrent d'une estimation inexacte de la similarité des caractéristiques ou de la discordance sémantique. Dans cet article, nous présentons un cadre de regroupement d'images basé sur l'étiquetage pseudo-sémantique (SPICE), qui divise le réseau de clustering en un modèle de caractéristiques pour mesurer la similarité au niveau des instances et une tête de clustering pour identifier la discordance au niveau des clusters. Nous concevons deux algorithmes d'étiquetage pseudo-sémantique, l'étiquetage pseudo-prototypique et l'étiquetage pseudo-fiable, qui permettent une auto-supervision précise et fiable du clustering. Sans utiliser aucune étiquette réelle, nous optimisons le réseau de clustering en trois étapes : 1) entraîner le modèle de caractéristiques par apprentissage contrastif pour mesurer la similarité des instances, 2) entraîner la tête de clustering avec l'algorithme d'étiquetage pseudo-prototypique pour identifier les sémantiques des clusters, et 3) entraîner conjointement le modèle de caractéristiques et la tête de clustering avec l'algorithme d'étiquetage pseudo-fiable pour améliorer les performances du clustering. Des résultats expérimentaux approfondis montrent que SPICE réalise des améliorations significatives (~10%) par rapport aux méthodes existantes et établit de nouveaux résultats d'avant-garde en matière de clustering sur six jeux de données d'images基准数据集 (benchmark datasets) selon trois métriques populaires. De manière importante, SPICE réduit considérablement l'écart entre la classification non supervisée et entièrement supervisée ; par exemple, il n'y a qu'une différence d'exactitude de 2% (91,8% contre 93,8%) sur CIFAR-10. Notre code est désormais disponible publiquement sur https://github.com/niuchuangnn/SPICE.Note: "基准数据集" is not a common French term and is therefore left in parentheses as "benchmark datasets" to ensure clarity for the reader.

SPICE : Étiquetage Sémantique Pseudo pour le Regroupement d'Images | Articles de recherche récents | HyperAI