Command Palette
Search for a command to run...
SimMatch : Apprentissage semi-supervisé par correspondance de similarité
SimMatch : Apprentissage semi-supervisé par correspondance de similarité
Mingkai Zheng Shan You Lang Huang Fei Wang Chen Qian Chang Xu
Résumé
L’apprentissage avec peu de données étiquetées constitue un problème ancien au sein de la communauté de recherche en vision par ordinateur et apprentissage automatique. Dans cet article, nous introduisons un nouveau cadre d’apprentissage semi-supervisé, nommé SimMatch, qui considère simultanément la similarité sémantique et la similarité d’instance. Dans SimMatch, la régularisation de cohérence est appliquée à la fois au niveau sémantique et au niveau d’instance. Les différentes versions augmentées d’une même instance sont encouragées à produire la même prédiction de classe, tout en préservant des relations de similarité similaires par rapport aux autres instances. Ensuite, nous introduisons un tampon mémoire étiqueté afin d’exploiter pleinement les étiquettes de vérité terrain au niveau d’instance et de combler les écarts entre les similarités sémantiques et les similarités d’instance. Enfin, nous proposons les opérations d’éclatement (unfolding) et d’agrégation (aggregation), qui permettent une transformation isomorphe entre ces deux types de similarité. Ainsi, les pseudo-étiquettes sémantiques et les pseudo-étiquettes d’instance peuvent s’alimenter mutuellement afin de générer des cibles de correspondance de meilleure qualité et plus fiables. Des résultats expérimentaux étendus démontrent que SimMatch améliore significativement les performances des tâches d’apprentissage semi-supervisé sur diverses bases de données standard et dans différentes configurations. Notamment, après 400 époques d’entraînement, SimMatch atteint une précision Top-1 de 67,2 % et 74,4 % respectivement avec 1 % et 10 % d’exemples étiquetés sur ImageNet, surpassant de manière significative les méthodes de référence ainsi que les cadres précédents d’apprentissage semi-supervisé. Le code source et les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/KyleZheng1997/simmatch.