HyperAIHyperAI
il y a 11 jours

Augmenter l’apprentissage semi-supervisé avec des données non étiquetées non contraintes

Shuvendu Roy, Ali Etemad
Augmenter l’apprentissage semi-supervisé avec des données non étiquetées non contraintes
Résumé

Nous proposons UnMixMatch, un cadre d'apprentissage semi-supervisé capable d'apprendre des représentations efficaces à partir de données non étiquetées non contraintes, afin d'améliorer à grande échelle les performances. La plupart des méthodes existantes en apprentissage semi-supervisé reposent sur l'hypothèse que les échantillons étiquetés et non étiquetés sont tirés de la même distribution, ce qui limite le potentiel d'amélioration grâce à l'utilisation de données non étiquetées librement disponibles. En conséquence, la généralisation et la scalabilité de l'apprentissage semi-supervisé sont fréquemment entravées par cette hypothèse. Notre méthode vise à surmonter ces contraintes et à exploiter efficacement les données non étiquetées non contraintes dans le cadre de l'apprentissage semi-supervisé. UnMixMatch se compose de trois composants principaux : un apprenant supervisé utilisant des augmentations rigides pour assurer une régularisation forte, un régulariseur de cohérence contrastive permettant d'apprendre des représentations sous-jacentes à partir des données non étiquetées, et une perte auto-supervisée visant à renforcer les représentations apprises à partir des données non étiquetées. Nous menons des expériences approfondies sur quatre jeux de données couramment utilisés et démontrons des performances supérieures par rapport aux méthodes existantes, avec une amélioration de performance de 4,79 %. Des études d'ablation et de sensibilité étendues confirment l'efficacité et l'impact de chacun des composants proposés dans notre méthode.

Augmenter l’apprentissage semi-supervisé avec des données non étiquetées non contraintes | Articles de recherche récents | HyperAI