11일 전

의상 규정: 고해상도 다중 카테고리 가상 시착

Davide Morelli, Matteo Fincato, Marcella Cornia, Federico Landi, Fabio Cesari, Rita Cucchiara
의상 규정: 고해상도 다중 카테고리 가상 시착
초록

이미지 기반 가상 시착 기술은 옷의 외형을 타겟 인물의 이미지에 전달하는 것을 목표로 한다. 기존 연구는 주로 상의(예: 티셔츠, 셔츠, 상의 등)에 초점을 맞추며 하의나 전신 의류에 대한 고려가 부족하다. 이러한 한계는 주로 하나의 핵심 원인에서 비롯된다. 현재 공개된 이미지 기반 가상 시착을 위한 데이터셋은 다양한 의류 카테고리를 반영하지 못하고 있어, 이 분야의 발전을 제한하고 있다. 이러한 문제를 해결하기 위해, 다중 카테고리 의류 이미지를 포함하는 '드레스 코드(Dress Code)'를 소개한다. 드레스 코드는 이미지 기반 가상 시착을 위한 기존 공개 데이터셋보다 3배 이상 크며, 전신 전면 시점 참조 모델을 포함한 고해상도 쌍(1024x768) 이미지를 보유하고 있다. 고해상도의 시각적 품질이 뛰어나 세부 정보가 풍부한 시착 이미지를 생성하기 위해, 미세한 구분 특징을 학습하는 방안을 제안한다. 구체적으로, 이미지 또는 패치 수준이 아닌 픽셀 수준에서 예측을 수행하는 의미 인식형 판별자(semantic-aware discriminator)를 활용한다. 광범위한 실험적 평가를 통해 제안된 방법이 시각적 품질과 정량적 결과 측면에서 기존 베이스라인 및 최첨단 기술을 모두 초월함을 입증하였다. 드레스 코드 데이터셋은 공개적으로 제공되며, 다음 링크에서 접근 가능하다: https://github.com/aimagelab/dress-code.

의상 규정: 고해상도 다중 카테고리 가상 시착 | 최신 연구 논문 | HyperAI초신경