
要約
疎行列分解は、解釈可能なデータ分解を取得するための一般的なツールであり、データ補完やノイズ除去にも効果的です。大規模データセットへの適用性については、オンライン手法やランダム化手法が提案されてきましたが、これらの手法は行列の次元のいずれか一方の複雑さを軽減するものであり、両方の次元を同時に軽減するものではありません。本論文では、両方の次元で非常に大規模な行列に取り組みます。我々は、テラバイトスケールのデータセットに対して優雅にスケーリングできる新しい分解手法を提案します。この手法は、従来のアルゴリズムでは合理的な時間内に処理できなかったような大規模なデータセットに対応できます。我々は、大量の機能磁気共鳴画像(fMRI)データと推薦システムにおける行列補完問題において、当手法の効率性を示しました。これらの問題において、最新の座標降下法と比較して大幅な高速化を達成しています。注:- "Sparse matrix factorization" は「疎行列分解」と訳しました。- "functional Magnetic Resonance Imaging (fMRI)" は「機能磁気共鳴画像(fMRI)」と訳しました。- "coordinate descent methods" は「座標降下法」と訳しました。