2달 전

다중모드 준자동회귀: 새로운 패션 제품의 시각적 인기 예측

Stefanos I. Papadopoulos; Christos Koutlis; Symeon Papadopoulos; Ioannis Kompatsiaris
다중모드 준자동회귀: 새로운 패션 제품의 시각적 인기 예측
초록

패션 산업에서 소비자의 선호도를 추정하는 것은 이 정보를 적절히 활용하면 수익 측면에서 유리할 수 있으므로 매우 중요합니다. 패션의 트렌드 감지는 패션 산업의 빠른 변화 속도 때문에 어려운 과제입니다. 또한, 새로운 의류 디자인의 시각적 인기를 예측하는 것은 역사적 데이터 부족으로 인해 더욱 어려워집니다. 이를 위해 우리는 MuQAR라는 다중모달 준자동회귀(Quasi-AutoRegressive) 딥러닝 아키텍처를 제안합니다. 이 아키텍처는 두 가지 모듈을 결합합니다: (1) 제품의 범주적, 시각적 및 텍스트 특성을 처리하는 다중모달 다층 퍼셉트론과 (2) 제품 속성의 "타겟" 시간열과 다른 모든 속성의 "외생" 시간열을 모델링하는 준자동회귀 신경망입니다.우리는 컴퓨터 비전, 이미지 분류 및 이미지 캡셔닝 기술을 사용하여 새로운 제품 이미지에서 시각적 특징과 텍스트 설명을 자동으로 추출합니다. 패션에서 제품 디자인은 처음에 시각적으로 표현되며, 이러한 특징들은 디자이너들의 창작 과정에 간섭하지 않으면서도 제품의 독특한 특성을 나타냅니다 (예: 수작업으로 작성된 텍스트 등의 추가 입력 요구).우리는 제품의 타겟 속성 시간열을 시간적인 인기 패턴의 대리 변수로 활용하여 역사적 데이터 부족 문제를 완화하며, 외생 시간열은 상호 연관된 속성들 사이의 트렌드를 포착하는 데 도움을 줍니다. 우리는 Mallzee와 SHIFT15m라는 두 개的大规模图像时尚数据集上进行了广泛的消融分析,以评估MuQAR的充分性,并使用Amazon Reviews: Home and Kitchen数据集来评估其在其他领域的泛化能力。在VISUELLE数据集上的比较研究表明,MuQAR在WAPE和MAE方面分别能够与当前领域的最先进水平竞争并超越4.65%和4.8%。(注:最后两句话中的“大规模图像时尚数据集”、“消融分析”、“泛化能力”等术语在韩文中没有直接对应的通用术语,因此保留了中文表述。为了确保信息完整性和专业性,建议在这部分加上英文原文标注。)我们在Mallzee和SHIFT15m两个大规模图像时尚数据集上进行了广泛的消融分析,以评估MuQAR的充分性,并使用Amazon Reviews: Home and Kitchen数据集来评估其在其他领域的泛化能力(We perform an extensive ablation analysis on two large-scale image fashion datasets, Mallzee and SHIFT15m to assess the adequacy of MuQAR and also use the Amazon Reviews: Home and Kitchen dataset to assess generalisability to other domains)。在VISUELLE数据集上的比较研究表明,MuQAR在WAPE和MAE方面分别能够与当前领域的最先进水平竞争并超越4.65%和4.8%(A comparative study on the VISUELLE dataset shows that MuQAR is capable of competing and surpassing the domain's current state of the art by 4.65% and 4.8% in terms of WAPE and MAE respectively)。