HyperAI

Apprentissage Multiple

Apprentissage multipleIl s’agit d’une méthode de base en reconnaissance de formes, qui consiste à rechercher l’essence des choses dans les phénomènes observés et à trouver les lois internes qui génèrent les données.

L'apprentissage des variétés peut être divisé en deux types : les algorithmes d'apprentissage des variétés linéaires et les algorithmes d'apprentissage des variétés non linéaires. Les algorithmes d'apprentissage de variétés non linéaires incluent l'isomap, les cartes propres laplaciennes et l'intégration localement linéaire. Les méthodes linéaires comprennent l’analyse en composantes principales et la mise à l’échelle multidimensionnelle.

Cartographie isométrique

L'objectif d'Isomap est de trouver l'intégration de faible dimension correspondante pour une variété de grande dimension donnée, de sorte que la structure voisine entre les points de données sur la variété de grande dimension puisse être maintenue dans l'intégration de faible dimension. Isomap utilise la distance géodésique en géométrie différentielle pour calculer la distance entre les points de données sur les variétés de grande dimension.

avantage:

  • Le processus de résolution s'appuie sur les problèmes de valeurs propres et de vecteurs propres de l'algèbre linéaire, ce qui garantit la robustesse et l'optimalité globale des résultats ;
  • La variance résiduelle peut être utilisée pour déterminer la dimension essentielle de l’intégration sous-jacente de faible dimension.
  • La méthode Isomap ne nécessite qu'un seul paramètre à déterminer lors du calcul (le paramètre voisin k ou le rayon de voisinage e).

Carte propre du Laplacien

La carte propre de Laplace utilise un graphe pondéré non orienté pour décrire une variété, puis utilise l'incorporation de graphe pour trouver une représentation de faible dimension. C'est le plus rapide, mais l'effet est relativement insatisfaisant.

Enrobage linéaire local

L'intégration linéaire locale est une étape importante dans la réduction de la dimensionnalité non linéaire, et son algorithme peut être résumé en trois étapes :

  • Trouver les k voisins les plus proches de chaque point d’échantillonnage ;
  • La matrice de pondération de reconstruction locale de chaque point d'échantillon est calculée à partir des points voisins du point d'échantillon ;
  • La valeur de sortie du point d'échantillonnage est calculée sur la base de la matrice de pondération de reconstruction locale du point d'échantillonnage et de ses points voisins.

Analyse en composantes principales

De nouvelles variables sont obtenues en combinant linéairement les variables d’origine. La variance entre ces variables est la plus grande. Étant donné que la différence entre les variables originales des données peut ne pas être importante et que les descriptions sont similaires, l’efficacité est faible.

Mise à l'échelle multidimensionnelle

L'analyse d'échelle multidimensionnelle consiste à exprimer les données observées avec moins de dimensions, mais elle utilise la similarité entre les échantillons appariés pour construire un espace de faible dimension approprié afin que la similarité entre les échantillons et l'espace de grande dimension soit aussi cohérente que possible.

La méthode d'analyse d'échelle multidimensionnelle comporte cinq éléments clés, à savoir le sujet, l'objet, le critère, le poids du critère et le poids du sujet, comme suit :

  • Objet : L'objet en cours d'évaluation. On peut considérer qu'il existe plusieurs catégories à classer.
  • Objet : L'unité qui évalue l'objet. Ce sont les données de formation.
  • Critères : Normes définies par soi-même en fonction de l'objectif de la recherche et utilisées pour évaluer la qualité de l'objet.
  • Pondération des critères : Après avoir pondéré l'importance des critères, le sujet attribue une valeur de pondération à chaque critère.
  • Pondération du sujet : Après avoir pesé l’importance des critères, le chercheur attribue une valeur de pondération au sujet.