FixMatch : Simplification de l'apprentissage semi-supervisé grâce à la cohérence et à la confiance

L'apprentissage semi-supervisé (SSL) constitue un moyen efficace d'utiliser des données non étiquetées pour améliorer les performances d'un modèle. Dans cet article, nous mettons en évidence le pouvoir d'une combinaison simple de deux méthodes courantes de SSL : la régularisation par cohérence et la pseudo-étiquetage. Notre algorithme, FixMatch, génère d'abord des pseudo-étiquettes à partir des prédictions du modèle sur des images non étiquetées soumises à une augmentation faible. Pour une image donnée, la pseudo-étiquette n'est conservée que si le modèle produit une prédiction à haute confiance. Le modèle est ensuite entraîné à prédire cette pseudo-étiquette lorsqu'il reçoit une version fortement augmentée de la même image. Malgré sa simplicité, nous montrons que FixMatch atteint des performances de pointe sur diverses benchmarks standards d'apprentissage semi-supervisé, notamment 94,93 % de précision sur CIFAR-10 avec seulement 250 étiquettes, et 88,61 % avec 40 étiquettes — soit seulement 4 étiquettes par classe. Étant donné que FixMatch présente de nombreuses similitudes avec d'autres méthodes SSL ayant des performances inférieures, nous menons une étude d'ablation approfondie afin d'identifier les facteurs expérimentaux les plus importants pour le succès de FixMatch. Nous mettons notre code à disposition à l'adresse suivante : https://github.com/google-research/fixmatch.