HyperAI

Apprentissage Semi-supervisé

Apprentissage semi-superviséIl s’agit d’une technique d’apprentissage entre l’apprentissage supervisé et l’apprentissage non supervisé. Il utilise des échantillons étiquetés et non étiquetés pour l'apprentissage.

L'apprentissage semi-supervisé permet à l'apprenant d'utiliser automatiquement des échantillons non étiquetés pour améliorer les performances d'apprentissage sans dépendre d'interactions externes.

Deux hypothèses courantes sur l'apprentissage semi-supervisé

L’une d’elles est « l’hypothèse de cluster », qui suppose que les données ont une structure de cluster et que les échantillons du même cluster appartiennent à la même catégorie.

L’autre type est « l’hypothèse de variété », qui suppose que les données sont distribuées sur une structure de variété et que les échantillons adjacents ont des valeurs de sortie similaires.

Brève introduction à la théorie de l'apprentissage semi-supervisé :

L'apprentissage semi-supervisé comporte deux ensembles d'échantillons, l'un étiqueté et l'autre non étiqueté.

Étiquette = { ( xi , yi ) }, Non étiqueté = { ( xi ) }. Et quantitativement, L << U.

1) En utilisant uniquement des échantillons étiquetés, nous pouvons générer des algorithmes de classification supervisés ;

2) En utilisant uniquement des échantillons non étiquetés, nous pouvons générer des algorithmes de clustering non supervisés ;

3) En utilisant les deux, nous espérons ajouter des échantillons non étiquetés dans 1 pour améliorer l'effet de la classification supervisée ; de même, nous espérons ajouter des échantillons étiquetés en 2 pour améliorer l’effet du clustering non supervisé.

D’une manière générale, l’apprentissage semi-supervisé se concentre sur l’ajout d’échantillons non étiquetés à des algorithmes de classification supervisés pour obtenir une classification semi-supervisée. Autrement dit, des échantillons non étiquetés sont ajoutés à 1 pour améliorer l’effet de classification.

Classification des algorithmes d'apprentissage semi-supervisé :

1) Algorithme d’auto-formation ;

2) Modèles génératifs

3) SVM (machines à vecteurs de support semi-supervisées) ;

4) méthodes basées sur des graphiques ;

5) Algorithme d'apprentissage multivue.

Références

【1】https://blog.csdn.net/ice110956/article/details/13775071

【2】http://blog.sciencenet.cn/blog-242887-309591.html

【3】https://www.zybuluo.com/Team/note/1133211