11日前

Tree-SNE:t-SNEを用いた階層的クラスタリングと可視化

Isaac Robinson, Emma Pierce-Hoffman
Tree-SNE:t-SNEを用いた階層的クラスタリングと可視化
要約

t-SNEおよび階層的クラスタリングは、特に生物学分野において広く用いられる探索的データ解析手法である。近年のt-SNEの高速化およびより細かい構造の抽出に向けた進展を基盤とし、本研究では1次元のt-SNE埋め込みを段重ねにした手法を用いて、階層的クラスタリングと可視化を統合した「tree-SNE」というアルゴリズムを提案する。さらに、複数スケールにわたるクラスタの安定性に基づき、クラスタ数の事前知識なしに最適なクラスタ割り当てを自動的に推奨する「alpha-clustering」を導入する。本手法の有効性を、手書き数字画像、血液細胞の質量細胞計測(CyTOF)データ、網膜細胞の単細胞RNAシークエンシング(scRNA-seq)データの3種類のデータセットにおいて検証した。また、可視化の妥当性を裏付けるために、alpha-clusteringを用いて複数の画像データセットで、最先端の手法と同等以上の非教師付きクラスタリング結果を達成した。本研究で開発したソフトウェアは、https://github.com/isaacrob/treesne にて公開されている。

Tree-SNE:t-SNEを用いた階層的クラスタリングと可視化 | 最新論文 | HyperAI超神経