한 달 전

대규모 행렬 분해를 위한 사전 학습

Arthur Mensch; Julien Mairal; Bertrand Thirion; Gaël Varoquaux
대규모 행렬 분해를 위한 사전 학습
초록

희소 행렬 분해는 해석 가능한 데이터 분해를 얻기 위한 인기 있는 도구로, 데이터 완성이나 노이즈 제거에도 효과적입니다. 이 방법의 대규모 데이터셋에 대한 적용성은 온라인 및 랜덤화 방법을 통해 하나의 행렬 차원에서 복잡도를 줄이는 데 주목해왔지만, 두 개의 차원 모두에서 이를 해결하지는 못했습니다. 본 논문에서는 두 차원 모두에서 매우 큰 행렬을 다루는 문제를 다룹니다. 우리는 테라바이트 규모의 데이터셋을 처리할 수 있도록 우아하게 확장되는 새로운 분해 방법을 제안합니다. 이전 알고리즘들이 합리적인 시간 내에 처리할 수 없었던 데이터셋에 대해 이러한 접근 방식의 효율성을 거대한 기능 자기 공명 영상(fMRI) 데이터와 추천 시스템용 행렬 완성 문제에서 입증하였습니다. 여기서 우리는 최신 좌표 하강법과 비교하여 상당한 속도 향상을 얻었습니다.

대규모 행렬 분해를 위한 사전 학습 | 최신 연구 논문 | HyperAI초신경