13日前

パラメトリックUMAP埋め込みによる表現学習および準教師あり学習

Tim Sainburg, Leland McInnes, Timothy Q Gentner
パラメトリックUMAP埋め込みによる表現学習および準教師あり学習
要約

UMAPは、構造化されたデータの低次元埋め込みを求めるため、応用リーマン幾何学および代数トポロジーを用いた非パラメトリックなグラフベース次元削減アルゴリズムである。UMAPアルゴリズムは以下の2段階から構成される:(1)データセットのグラフィカル表現(ファジィ単体複体)を計算し、(2)確率的勾配降下法を用いて、グラフの低次元埋め込みを最適化する。本研究では、UMAPの第2段階をニューラルネットワークの重みに対するパラメトリック最適化に拡張し、データと埋め込みの間のパラメトリックな関係を学習する。まず、パラメトリックUMAPが非パラメトリックな対応手法と同等の性能を発揮することを示すとともに、学習されたパラメトリックマッピングの利点(例:新しいデータに対する高速なオンライン埋め込み)を享受できることを確認した。次に、UMAPを正則化手法として活用し、オートエンコーダの潜在空間分布を制約することで、グローバル構造の保存をパラメトリックに変化させ、ラベルなしデータの構造を捉えることにより、半教師あり学習における分類器の精度を向上させることを検証した。Google Colabによるデモ:https://colab.research.google.com/drive/1WkXVZ5pnMrm17m0YgmtoNjM_XHdnE5Vp?usp=sharing

パラメトリックUMAP埋め込みによる表現学習および準教師あり学習 | 最新論文 | HyperAI超神経