원시 픽셀을 활용한 추천 시스템 평가를 위한 이미지 데이터셋

추천 시스템(RS)은 명시적 아이디(ID) 특징을 활용함으로써 상당한 성과를 거두었다. 그러나 콘텐츠 특징, 특히 순수한 이미지 픽셀 특징의 잠재력은 여전히 상대적으로 탐색되지 않은 상태이다. 대규모이고 다양한, 콘텐츠 중심의 이미지 추천 데이터셋의 부족은 원시 이미지를 아이템 표현으로 사용하는 데 걸림돌이 되었다. 이러한 맥락에서 본 연구는 약 2억 개의 사용자-이미지 상호작용, 3,000만 명의 사용자, 40만 개의 고품질 커버 이미지를 포함하는 대규모 이미지 중심 추천 데이터셋인 PixelRec를 제안한다. PixelRec는 원시 이미지 픽셀에 직접 접근할 수 있도록 제공함으로써, 추천 모델이 직접 픽셀로부터 아이템 표현을 학습할 수 있도록 한다. 이를 통해 데이터셋의 활용 가능성을 입증하기 위해, 먼저 PixelRec에서 학습된 전통적인 순수 ID 기반 기준 모델(IDNet)의 성능을 제시한다. 그 후, 데이터셋의 이미지 특징의 효과를 입증하기 위해, IDNet에서 사용하는 아이템 ID 임베딩을 고성능 비전 인코더로 대체하여, 원시 이미지 픽셀을 기반으로 아이템을 표현하는 새로운 모델인 PixelNet을 제안한다. 연구 결과, IDNet이 매우 효과적이라고 알려진 표준적인 비콜드스타트 추천 환경에서도 PixelNet이 IDNet과 동등하거나 더 우수한 성능을 보였음을 확인하였다. 더불어 PixelNet은 콜드스타트 및 크로스도메인 추천 시나리오에서 IDNet보다 더 효과적이라는 여러 장점도 보였다. 이러한 결과는 PixelRec 내 시각적 특징의 중요성을 강조한다. 우리는 PixelRec가 이미지 픽셀 콘텐츠에 중점을 둔 추천 모델 연구를 위한 핵심 자원이자 테스트 벤치로 기능할 수 있을 것이라 믿는다. 데이터셋, 코드, 랭킹 목록은 https://github.com/westlake-repl/PixelRec 에서 공개될 예정이다.