HyperAI超神経

多様体学習 多様体学習

多様な学習これは、観察された現象に基づいて物事の本質を見つけ、データを生成する固有の法則を見つけるパターン認識の基本的な方法です。

多様体学習は、線形多様体学習アルゴリズムと非線形多様体学習アルゴリズムに分けられ、非線形多様体学習アルゴリズムにはアイソメトリック マッピング Isomap、ラプラシアン固有マップが含まれ、局所線形埋め込みには主成分分析と多次元スケーリングが含まれます。

アイソメトリックマッピング

Isomap の目的は、特定の高次元多様体に対応する低次元埋め込みを見つけて、高次元多様体上のデータ点間の隣接構造を低次元埋め込みで維持できるようにすることです。 Isomap は、高次元多様体上のデータ点間の距離を計算するときに、微分幾何学からの測地線距離を使用します。

アドバンテージ:

  • 解法プロセスは線形代数の固有値と固有ベクトルの問題に依存しており、結果の堅牢性と全体的な最適性が保証されます。
  • 暗黙的低次元埋め込みの本質的な次元数は、残差分散を通じて決定できます。
  • Isomap 法の計算プロセス中に決定する必要があるパラメーターは 1 つだけ (最近傍パラメーター k または近傍半径 e) です。

ラプラシアン固有マップ

ラプラシアン固有マップは、無向重み付きグラフを使用して多様体を記述し、次にグラフ埋め込みを使用して低次元表現を見つけます。これは最も高速ですが、効果は比較的不十分です。

ローカル線形埋め込み

ローカル線形埋め込みは非線形次元削減におけるマイルストーンであり、そのアルゴリズムは次の 3 つのステップに要約できます。

  • 各サンプル点の k 個の最近傍点を見つけます。
  • 各サンプル点のローカル再構成重み行列をその近傍点から計算します。
  • サンプル点の出力値は、サンプル点とその近傍点の局所再構成重み行列から計算されます。

主成分分析

新しい変数は元の変数の線形結合によって得られ、これらの変数間の分散が最も大きくなります。データの元の変数には大きな違いがなく、同じ内容を記述している可能性があるため、効率は低くなります。

多次元尺度分析

多次元スケーリング分析は、観測データをより少ない次元で表現しますが、サンプルのペア間の類似性を使用して適切な低次元空間を構築し、サンプルと高次元空間の間の類似性が可能な限り一致するようにします。

多次元尺度分析手法には、主体、対象、基準、基準重み、主体重みという 5 つの主要な要素があります。詳細は次のとおりです。

  • オブジェクト: 評価されるオブジェクト。いくつかのカテゴリに分類することができます。
  • Subject: オブジェクトが評価される単位。それは訓練データです。
  • 基準: 対象物の品質を評価するための研究目的に基づいた独自の基準。
  • 基準の重み: エンティティは基準の重要性を測定した後、各基準に重み値を割り当てます。
  • 被験者の重み: 基準の重要性を評価した後、研究者は被験者に重みの値を割り当てます。