15日前

階層的最近傍グラフ埋め込みによる効率的な次元削減

M. Saquib Sarfraz, Marios Koulakis, Constantin Seibold, Rainer Stiefelhagen
階層的最近傍グラフ埋め込みによる効率的な次元削減
要約

次元削減は、機械学習における高次元データの可視化および前処理において極めて重要である。本研究では、元の空間における1-近傍近隣グラフに基づく階層構造を活用した新規手法を提案する。この手法は、データ分布のグループ化特性を複数のスケールで保持することを目的としている。本手法の核となるのは、最適化を必要としない射影であり、最新のt-SNEおよびUMAPと同等の性能と可視化品質を実現しつつ、実行時間において1桁以上高速である。さらに、解釈性に優れたメカニズム、新しいデータへの投影能力、および可視化における自然なクラスタ分離の特性から、汎用的な非教師あり次元削減手法としての実用性を有している。本論文では、提案手法の理論的妥当性を議論し、1,000~1,100万サンプル、28~16,000次元にわたる多様なデータセットを用いて評価を行った。複数の指標および目的次元に対して、他の最先端手法と比較し、その効率性と性能の優位性を示した。実装コードは、https://github.com/koulakis/h-nne にて公開されている。

階層的最近傍グラフ埋め込みによる効率的な次元削減 | 最新論文 | HyperAI超神経