
초록
희소 행렬 분해는 해석 가능한 데이터 분해를 얻기 위한 인기 있는 도구로, 데이터 완성이나 노이즈 제거에도 효과적입니다. 이 방법의 대규모 데이터셋에 대한 적용성은 온라인 및 랜덤화 방법을 통해 하나의 행렬 차원에서 복잡도를 줄이는 데 주목해왔지만, 두 개의 차원 모두에서 이를 해결하지는 못했습니다. 본 논문에서는 두 차원 모두에서 매우 큰 행렬을 다루는 문제를 다룹니다. 우리는 테라바이트 규모의 데이터셋을 처리할 수 있도록 우아하게 확장되는 새로운 분해 방법을 제안합니다. 이전 알고리즘들이 합리적인 시간 내에 처리할 수 없었던 데이터셋에 대해 이러한 접근 방식의 효율성을 거대한 기능 자기 공명 영상(fMRI) 데이터와 추천 시스템용 행렬 완성 문제에서 입증하였습니다. 여기서 우리는 최신 좌표 하강법과 비교하여 상당한 속도 향상을 얻었습니다.