HyperAIHyperAI
il y a 2 mois

SequenceMatch : Réexamen de la conception des augmentations faibles-fortes pour l'apprentissage semi-supervisé

Khanh-Binh Nguyen
SequenceMatch : Réexamen de la conception des augmentations faibles-fortes pour l'apprentissage semi-supervisé
Résumé

L'apprentissage semi-supervisé (SSL) est devenu populaire ces dernières années car il permet l'entraînement d'un modèle à l'aide d'une grande quantité de données non étiquetées. Cependant, un problème auquel de nombreuses méthodes SSL sont confrontées est le biais de confirmation, qui se produit lorsque le modèle est surajusté à un petit ensemble de données d'entraînement étiquetées et produit des prédictions excessivement confiantes et incorrectes. Pour résoudre ce problème, nous proposons SequenceMatch, une méthode SSL efficace qui utilise plusieurs augmentations de données. L'élément clé de SequenceMatch est l'inclusion d'une augmentation intermédiaire pour les données non étiquetées. En exploitant différentes augmentations et les contraintes de cohérence entre chaque paire d'exemples augmentés, SequenceMatch aide à réduire la divergence entre la distribution des prédictions du modèle pour les exemples faiblement et fortement augmentés. De plus, SequenceMatch définit deux contraintes de cohérence différentes pour les prédictions à haute et basse confiance. Par conséquent, SequenceMatch est plus efficace en termes de données que ReMixMatch et plus rapide en termes de temps que ReMixMatch ($\times4$) et CoMatch ($\times2$), tout en offrant une précision supérieure. Malgré sa simplicité, SequenceMatch surpasse constamment les méthodes antérieures sur des benchmarks standards tels que CIFAR-10/100, SVHN et STL-10. Il dépasse également largement les méthodes précédentes de pointe sur des jeux de données à grande échelle comme ImageNet, avec un taux d'erreur de 38,46 %. Le code source est disponible à l'adresse suivante : https://github.com/beandkay/SequenceMatch.

SequenceMatch : Réexamen de la conception des augmentations faibles-fortes pour l'apprentissage semi-supervisé | Articles de recherche récents | HyperAI