11일 전

Tree-SNE: t-SNE를 이용한 계층적 군집화 및 시각화

Isaac Robinson, Emma Pierce-Hoffman
Tree-SNE: t-SNE를 이용한 계층적 군집화 및 시각화
초록

t-SNE와 계층적 군집화는 생물학 분야를 포함한 탐색적 데이터 분석에서 널리 사용되는 방법들이다. 최근 t-SNE의 속도 향상과 더 세밀한 구조 탐지 기술의 발전을 바탕으로, 우리는 일차원 t-SNE 임베딩을 단계적으로 쌓아 올리는 방식의 계층적 군집화 및 시각화 알고리즘인 tree-SNE를 제안한다. 또한, 군집의 안정성을 다중 스케일에서 평가함으로써 군집 수에 대한 사전 지식 없이 최적의 군집 할당을 제안하는 alpha-clustering을 도입한다. 제안된 tree-SNE와 alpha-clustering의 효과성을 손글씨 숫자 이미지, 혈액 세포의 질량세포분석(CyTOF) 데이터, 그리고 망막 세포의 단일세포 RNA 시퀀싱(scRNA-seq) 데이터에 적용하여 검증하였다. 더 나아가, 시각화의 타당성을 입증하기 위해 alpha-clustering을 활용하여 여러 이미지 데이터셋에서 최신 기술 수준과 경쟁 가능한 비지도 군집화 결과를 도출하였다. 관련 소프트웨어는 https://github.com/isaacrob/treesne에서 제공된다.