16日前

次元削減ツールの動作原理を理解する:データ可視化におけるt-SNE、UMAP、TriMAP、PaCMAPの解明に向けた実証的研究

Yingfan Wang, Haiyang Huang, Cynthia Rudin, Yaron Shaposhnik
次元削減ツールの動作原理を理解する:データ可視化におけるt-SNE、UMAP、TriMAP、PaCMAPの解明に向けた実証的研究
要約

t-SNE、UMAP、TriMAPなどの次元削減(DR)手法は、多くの実世界データセットにおいて優れた可視化性能を示している。こうした手法が常に直面してきた課題の一つは、グローバル構造とローカル構造の両方を保つというトレードオフである。すなわち、これらの手法はいずれか一方の構造を保つことは可能であるが、両方を同時に保持することは難しい。本研究の主な目的は、ローカル構造とグローバル構造の両方を維持するためのDR手法における重要な要素を理解することである。アルゴリズムにおける選択の本質と、それらが低次元埋め込みに与える実証的影響を正しく理解せずに、より優れた手法を設計することは困難である。ローカル構造の維持を目的として、成功したDR手法のメカニズムに関する新たな理解に基づき、DR損失関数の設計に役立つ複数の有用な原則を提示する。一方、グローバル構造の維持を目的として、どの成分を保持するかという選択が重要であることが明らかになった。これらの知見を活かして、ローカル構造とグローバル構造の両方を保持する新しいDRアルゴリズム「ペアワイズ制御多様体近似射影(PaCMAP)」を提案する。本研究は、DR手法を構築する際にはどのような設計選択を行うべきか、また避けなければならないかについて、いくつか予期せぬ洞察を提供する。

次元削減ツールの動作原理を理解する:データ可視化におけるt-SNE、UMAP、TriMAP、PaCMAPの解明に向けた実証的研究 | 最新論文 | HyperAI超神経