2달 전

신경망 인자 분해기계를 이용한 희소 예측 분석

Xiangnan He; Tat-Seng Chua
신경망 인자 분해기계를 이용한 희소 예측 분석
초록

웹 애플리케이션의 많은 예측 작업은 사용자 ID와 성별, 직업과 같은 범주형 변수를 모델링해야 합니다. 표준 머신 러닝 기법을 적용하기 위해서는 이러한 범주형 예측 변수들을 원-핫 인코딩(one-hot encoding)을 통해 이진 특성 집합으로 항상 변환하여, 결과적으로 생성된 특성 벡터가 매우 희소(sparse)하게 됩니다. 이러한 희소한 데이터에서 효과적으로 학습하기 위해서는 특성 간의 상호작용을 고려하는 것이 중요합니다.팩토리제이션 머신(Factorization Machines, FMs)은 두 번째 차원의 특성 상호작용을 효율적으로 활용하기 위한 인기 있는 해결책입니다. 그러나 FM은 선형 방식으로 특성 상호작용을 모델링하므로, 실제 세계 데이터의 비선형적이고 복잡한 본질적인 구조를 포착하는 데 부족할 수 있습니다. 최근에는 구글의 Wide&Deep 및 마이크로소프트의 DeepCross와 같이 산업계에서 딥 뉴럴 네트워크를 이용해 비선형적인 특성 상호작용을 학습하는 방법이 제안되었지만, 깊은 구조는 이들을 훈련시키는 것을 어렵게 만듭니다.본 논문에서는 희소 환경에서 예측을 수행하기 위한 새로운 모델인 신경 팩토리제이션 머신(Neural Factorization Machine, NFM)을 제안합니다. NFM은 FM이 두 번째 차원의 특성 상호작용을 모델링하는 선형성을 유지하면서도, 신경망이 고차원의 특성 상호작용을 모델링하는 비선형성을 유연하게 결합합니다. 개념적으로 NFM은 FM보다 표현력이 더 우수하며, FM은 은닉층(hidden layers) 없이 NFM의 특수한 경우로 볼 수 있습니다. 두 회귀 작업에 대한 경험적 결과에 따르면, 단 하나의 은닉층만으로도 NFM은 FM에 비해 7.3%의 상대적인 개선 효과를 보여주며, 최근 딥러닝 방법인 Wide&Deep와 DeepCross에 비해 더 얕은 구조를 사용하지만 성능이 우수하고 실제로 훈련과 조정이 훨씬 쉽습니다.

신경망 인자 분해기계를 이용한 희소 예측 분석 | 최신 연구 논문 | HyperAI초신경