잘 구글링된 것은 절반 완성된 것: 이미지 기반 구글 트렌드를 활용한 신규 패션 제품 판매 예측의 다중 모달 접근법

새로운 패션 제품의 판매 예측은 많은 비즈니스 동태를 포함하는 어려운 문제로, 고전적인 예측 방법으로는 해결할 수 없습니다. 본 논문에서는 구글 트렌드 시계열 데이터 형태의 외부 지식을 체계적으로 탐색하고, 이를 새로운 패션 제품과 관련된 다중 모달 정보와 결합하여 과거 데이터가 부족한 상황에서도 효과적으로 판매량을 예측하는 방법에 대해 조사합니다. 특히, 외부 시계열 데이터의 표현을 학습하는 인코더와 구글 트렌드 인코딩 및 이용 가능한 시각적 정보와 메타데이터 정보를 바탕으로 판매량을 예측하는 디코더를 포함하는 신경망 기반 접근법을 제안합니다. 본 모델은 비자기회귀 방식으로 작동하여, 큰 초기 단계 오류의 복합 효과를 피합니다. 두 번째 기여점으로서, 이탈리아 패스트패션 기업 누날리(Nunalie)에서 2016년부터 2019년까지 판매된 실제 새로운 제품 5577개의 다중 모달 정보를 포함하는 새로운 패션 제품 판매 예측 작업용 공개 데이터셋인 VISUELLE를 소개합니다. 이 데이터셋은 제품 이미지, 메타데이터, 관련 판매량 및 연관된 구글 트렌드를 갖추고 있습니다. VISUELLE를 사용하여 우리의 접근법이 최신 대안들과 여러 베이스라인과 비교했을 때 백분율 오차와 절대 오차 측면에서 가장 정확하다는 것을 보여주었습니다. 특히 외부 지식의 추가가 가중 평균 백분율 오차(Weighted Absolute Percentage Error, WAPE) 측면에서 예측 정확도를 1.5% 향상시킨다는 점이 주목할 만하며, 이는 유익한 외부 정보 활용의 중요성을 드러냅니다. 코드와 데이터셋은 모두 https://github.com/HumaticsLAB/GTM-Transformer에서 제공됩니다.