한 달 전

문맥 인식 시각적 호환성 예측

Guillem Cucurull; Perouz Taslakian; David Vazquez
문맥 인식 시각적 호환성 예측
초록

우리는 어떻게 두 개 이상의 의류 아이템이 서로 호환되거나 시각적으로 매력적인지 판단할 수 있을까요? 이 질문의 일부 답변은 시각적 미학에 대한 이해에서 찾을 수 있으며, 개인의 선호도는 사회적 태도, 시간, 그리고 장소에 의해 형성되어 편향됩니다. 본 연구에서는 두 아이템 간의 호환성을 예측하는 방법을 제안합니다. 이 방법은 아이템들의 시각적 특성뿐만 아니라 그 맥락(context)을 기반으로 합니다. 우리는 맥락을 각 아이템과 호환되는 것으로 알려진 제품들로 정의합니다. 이 모델은 아이템 특성 간의 쌍별 비교에만 의존하는 다른 메트릭 학습 접근법들과 대조를 이루고 있습니다.호환성 예측 문제를 그래프 신경망(graph neural network)을 사용하여 해결하였습니다. 이 그래프 신경망은 제품 임베딩(product embeddings)을 그 맥락에 조건부로 생성하도록 학습됩니다. Polyvore와 Fashion-Gen, 그리고 아마존 데이터셋의 부분 집합에서 두 가지 예측 과제(빈칸 채우기와 아웃핏 호환성)를 테스트한 결과를 제시합니다. 맥락 정보를 사용할 때 최신 기술(state of the art) 수준의 성능을 달성하였으며, 더 많은 맥락이 사용될수록 테스트 성능이 개선됨을 보여주었습니다.

문맥 인식 시각적 호환성 예측 | 최신 연구 논문 | HyperAI초신경