17일 전

NISER: 인기 편향을 다루기 위한 정규화된 아이템 및 세션 표현

Priyanka Gupta, Diksha Garg, Pankaj Malhotra, Lovekesh Vig, Gautam Shroff
NISER: 인기 편향을 다루기 위한 정규화된 아이템 및 세션 표현
초록

세션 기반 추천(SR) 모델의 목적은 사용자의 세션 내 과거 행동(예: 상품 클릭) 정보를 활용하여 사용자가 다음에 클릭할 가능성이 높은 아이템을 추천하는 것이다. 최근 연구에서 세션 내 아이템 상호작용의 순서를 복잡한 아이템 전이를 더 잘 반영할 수 있도록 그래프 구조 데이터로 모델링할 수 있음을 보여주었다. 그래프 신경망(GNN)은 이러한 세션-그래프에 대한 유용한 표현을 학습할 수 있으며, 순차적 모델인 순환 신경망(RNN)과 같은 기존 모델보다 성능이 향상됨이 입증되었다[14]. 그러나 본 연구에서는 이러한 GNN 기반 추천 모델이 인기 편향(popularity bias) 문제를 겪고 있음을 지적한다. 즉, 모델이 인기 있는 아이템을 선호하게 되어, 덜 인기 있는 장미꼬리(long-tail) 아이템(즉, 드물게 등장하거나 낮은 빈도로 클릭되는 아이템)을 제대로 추천하지 못한다는 점이다. 따라서 실무적인 온라인 환경에서 매일 새로 등장하는 덜 인기 있는 신규 아이템에 대해 모델의 성능이 떨어진다. 본 연구에서는 이 문제의 일부 원인이 학습된 아이템 및 세션-그래프 표현(임베딩 벡터)의 크기 또는 노름(magnitude/norm)과 관련이 있음을 입증한다. 이를 해결하기 위해 정규화된 표현을 활용하는 학습 절차를 제안한다. 정규화된 아이템 및 세션-그래프 표현을 사용하는 모델은 오프라인 환경에서 덜 인기 있는 장미꼬리 아이템에 대해, 그리고 온라인 환경에서 새로 도입된 덜 인기 있는 아이템에 대해 모두 상당히 우수한 성능을 보였다. 또한, 본 연구의 접근법은 세 가지 벤치마크 데이터셋에서 기존 최고 성능(SOTA) 모델을 크게 개선하였다.