Manifold-Lernen
Manifold LearningEs handelt sich um eine grundlegende Methode der Mustererkennung, die darauf basiert, in den beobachteten Phänomenen nach dem Wesen der Dinge zu suchen und die inneren Gesetze zu finden, die die Daten erzeugen.
Manifold-Learning kann in zwei Typen unterteilt werden: lineare Manifold-Learning-Algorithmen und nichtlineare Manifold-Learning-Algorithmen. Zu den nichtlinearen Mannigfaltigkeitslernalgorithmen gehören Isomap, Laplace-Eigenmaps und lokal lineare Einbettung. Zu den linearen Methoden gehören die Hauptkomponentenanalyse und die mehrdimensionale Skalierung.
Isometrische Kartierung
Das Ziel von Isomap besteht darin, für eine gegebene hochdimensionale Mannigfaltigkeit die entsprechende niedrigdimensionale Einbettung zu finden, sodass die Nachbarstruktur zwischen Datenpunkten auf der hochdimensionalen Mannigfaltigkeit in der niedrigdimensionalen Einbettung beibehalten werden kann. Isomap verwendet die geodätische Distanz in der Differentialgeometrie, um die Distanz zwischen Datenpunkten auf hochdimensionalen Mannigfaltigkeiten zu berechnen.
Vorteil:
- Der Lösungsprozess basiert auf den Eigenwert- und Eigenvektorproblemen der linearen Algebra, was die Robustheit und globale Optimalität der Ergebnisse gewährleistet;
- Mithilfe der Residualvarianz kann die wesentliche Dimension der zugrunde liegenden niedrigdimensionalen Einbettung bestimmt werden.
- Bei der Isomap-Methode muss während der Berechnung nur ein Parameter bestimmt werden (der Nachbarparameter k bzw. der Nachbarschaftsradius e).
Laplace-Eigenkarte
Die Laplace-Eigenabbildung verwendet einen ungerichteten gewichteten Graphen zur Beschreibung einer Mannigfaltigkeit und verwendet dann die Grapheneinbettung, um eine niedrigdimensionale Darstellung zu finden. Es ist zwar am schnellsten, die Wirkung ist jedoch relativ unbefriedigend.
Lokal lineare Einbettung
Die lokale lineare Einbettung ist ein Meilenstein in der nichtlinearen Dimensionsreduktion und ihr Algorithmus lässt sich in drei Schritten zusammenfassen:
- Finden Sie die k nächsten Nachbarn jedes Stichprobenpunkts.
- Die lokale Rekonstruktionsgewichtsmatrix jedes Stichprobenpunkts wird aus den Nachbarpunkten des Stichprobenpunkts berechnet.
- Der Ausgabewert des Stichprobenpunkts wird basierend auf der lokalen Rekonstruktionsgewichtsmatrix des Stichprobenpunkts und seiner Nachbarpunkte berechnet.
Hauptkomponentenanalyse
Neue Variablen werden durch lineare Kombination der ursprünglichen Variablen erhalten. Die Varianz zwischen diesen Variablen ist am größten. Da der Unterschied zwischen den ursprünglichen Variablen der Daten möglicherweise nicht groß ist und die Beschreibungen ähnlich sind, ist die Effizienz gering.
Multidimensionale Skalierung
Bei der mehrdimensionalen Skalierungsanalyse werden die beobachteten Daten mit weniger Dimensionen ausgedrückt, aber sie nutzt die Ähnlichkeit zwischen gepaarten Stichproben, um einen geeigneten niedrigdimensionalen Raum zu konstruieren, sodass die Ähnlichkeit zwischen den Stichproben und dem hochdimensionalen Raum so konsistent wie möglich ist.
Die Methode der multidimensionalen Skalierungsanalyse besteht aus fünf Schlüsselelementen, nämlich Subjekt, Objekt, Kriterium, Kriteriumsgewicht und Subjektgewicht, und zwar wie folgt:
- Objekt: Das auszuwertende Objekt. Es können mehrere Kategorien betrachtet werden, die klassifiziert werden müssen.
- Subjekt: Die Einheit, die das Objekt bewertet. Es sind die Trainingsdaten.
- Kriterien: Je nach Forschungszweck selbst definierte Maßstäbe, anhand derer die Qualität des Gegenstandes beurteilt wird.
- Gewichtung der Kriterien: Nach der Abwägung der Wichtigkeit der Kriterien weist der Proband jedem Kriterium einen Gewichtungswert zu.
- Gewichtung des Themas: Nachdem der Forscher die Wichtigkeit der Kriterien abgewogen hat, weist er dem Thema einen Gewichtungswert zu.