HyperAIHyperAI
il y a 2 mois

Clustering d'Information Invariante pour la Classification et la Segmentation d'Images Non Supervisées

Xu Ji; João F. Henriques; Andrea Vedaldi
Clustering d'Information Invariante pour la Classification et la Segmentation d'Images Non Supervisées
Résumé

Nous présentons un nouvel objectif de clustering qui apprend un classifieur neuronal à partir de zéro, en utilisant uniquement des échantillons de données non étiquetés. Le modèle découvre des clusters qui correspondent précisément aux classes sémantiques, obtenant des résultats d'avant-garde dans huit benchmarks de clustering non supervisé couvrant la classification et la segmentation d'images. Ces benchmarks incluent STL10, une variante non supervisée d'ImageNet, et CIFAR10, où nous surpassons significativement la précision de nos concurrents les plus proches de 6,6 et 9,5 points de pourcentage absolus respectivement. La méthode n'est pas spécialisée en vision par ordinateur et fonctionne sur tout ensemble de données d'échantillons appariés ; dans nos expériences, nous utilisons des transformations aléatoires pour obtenir une paire à partir de chaque image. Le réseau entraîné produit directement des étiquettes sémantiques, plutôt que des représentations à haute dimension qui nécessitent un traitement externe pour être utilisables dans le clustering sémantique. L'objectif est simplement de maximiser l'information mutuelle entre les affectations de classe de chaque paire. Il est facile à mettre en œuvre et rigoureusement fondé sur la théorie de l'information, ce qui signifie que nous évitons sans effort les solutions dégénérées auxquelles d'autres méthodes de clustering sont vulnérables. En plus du mode entièrement non supervisé, nous testons également deux configurations semi-supervisées. La première atteint une précision de 88,8 % sur la classification STL10, établissant un nouveau record mondial par rapport à toutes les méthodes existantes (que celles-ci soient supervisées, semi-supervisées ou non supervisées). La seconde montre une robustesse face à des réductions de 90 % dans la couverture des étiquettes, ce qui est pertinent pour les applications souhaitant utiliser de petites quantités d'étiquettes. github.com/xu-ji/IIC

Clustering d'Information Invariante pour la Classification et la Segmentation d'Images Non Supervisées | Articles de recherche récents | HyperAI