T – 分散型確率的近隣埋め込みこれは、相関パターンを識別するために使用できる次元削減のための機械学習方法です。その主な利点は、局所的な構造を保存することです。これは、高次元データ空間内で近い点は、低次元データ空間に投影されても依然として近いことを意味します。
T-SNEの特徴
低次元空間では、より重いロングテール分布を持つ t 分布を使用すると、混雑の問題や最適化の問題を回避できます。
T-SNE 勾配の利点
- 異なる点の場合は、より小さな距離を使用して大きな勾配を生成し、点間に反発を引き起こします。
- 異なる点が離れすぎないように、この反発力は無限大にはなりません。
不十分なT-SNE
- T-SNE は主に視覚化に使用されるため、他の側面ではパフォーマンスが低くなります。たとえば、テスト セットの次元削減では、明示的な予測部分がないため、テスト セットの次元を直接削減できません。
- T-SNE は、固有次元が高いデータ セットの場合、局所的な特徴を保持する傾向があり、2 ~ 3 次元空間に完全にマッピングすることは不可能です。
- T-SNE には独自の最適解と予測部分がありません。予測を行うには、次元削減を考慮して回帰式などのモデルを構築する必要があります。
- トレーニングは遅すぎるため、多くのツリーベースのアルゴリズムが T-SNE で改良されています。
関連語: T分布