16일 전

계층적 최근접 이웃 그래프 임베딩을 통한 효율적인 차원 축소

M. Saquib Sarfraz, Marios Koulakis, Constantin Seibold, Rainer Stiefelhagen
계층적 최근접 이웃 그래프 임베딩을 통한 효율적인 차원 축소
초록

차원 축소는 기계 학습을 위한 고차원 데이터 전처리뿐 아니라 시각화 측면에서도 매우 중요하다. 본 연구에서는 원본 공간에서 1-가장 가까운 이웃(1-nearest neighbor) 그래프를 기반으로 구축된 계층 구조를 활용하는 새로운 방법을 제안한다. 이 방법은 데이터 분포의 그룹화 특성을 다수의 수준에서 보존하는 데 초점을 맞추고 있다. 제안된 기법의 핵심은 최적화 과정 없이도 최신 t-SNE 및 UMAP 기법과 경쟁 가능한 성능과 시각화 품질을 제공하면서도, 실행 시간이 한 차원 빠른 특징을 지닌 투영 방식이다. 또한, 해석이 가능한 메커니즘, 새로운 데이터에 대한 투영 가능성, 시각화에서 자연스럽게 분리된 데이터 클러스터 형성 등으로 인해 일반적인 비지도 차원 축소 기법으로서의 유용성을 갖춘다. 본 논문에서는 제안된 방법의 타당성을 논의하며, 1,000에서 1,100만 개의 샘플, 28에서 16,000차원에 이르는 다양한 크기와 차원을 가진 데이터셋을 대상으로 실험을 수행한다. 여러 지표와 목표 차원에서 다른 최첨단 기법들과의 비교를 통해 그 효율성과 성능을 입증한다. 관련 코드는 https://github.com/koulakis/h-nne 에 공개되어 있다.

계층적 최근접 이웃 그래프 임베딩을 통한 효율적인 차원 축소 | 최신 연구 논문 | HyperAI초신경