11일 전

VITON-HD: 비일치 인지 정규화를 통한 고해상도 가상 시도

Seunghwan Choi, Sunghyun Park, Minsoo Lee, Jaegul Choo
VITON-HD: 비일치 인지 정규화를 통한 고해상도 가상 시도
초록

이미지 기반 가상 시착의 과제는 목표 의류를 사람의 해당 부위에 전달하는 것으로, 일반적으로 의류를 원하는 신체 부위에 적합하게 맞추고 왜곡된 의류를 사람의 이미지와 융합함으로써 해결된다. 최근 많은 연구가 진행되었지만, 합성된 이미지의 해상도는 여전히 낮은 수준(예: 256x192)에 머물러 있어 온라인 소비자들의 기대에 부응하지 못하는 핵심적인 제약 요소로 작용하고 있다. 본 연구에서는 이러한 제한이 여러 도전 과제에서 비롯된다고 주장한다. 해상도가 증가함에 따라 왜곡된 의류와 원하는 의류 영역 간의 정렬 불일치 영역에서 발생하는 아티팩트가 최종 결과물에서 두드러지게 나타나며, 기존 방법에서 사용되는 아키텍처는 고해상도 신체 부위를 생성하는 데 있어 성능이 낮고, 의류의 질감 선명도를 유지하는 데에도 한계가 있다. 이러한 문제를 해결하기 위해, 1024x768 해상도의 가상 시착 이미지를 성공적으로 합성할 수 있는 새로운 가상 시착 방법인 VITON-HD를 제안한다. 구체적으로, 먼저 가상 시착 합성을 안내하기 위한 세그멘테이션 맵을 준비하고, 이후 목표 의류를 주어진 사람의 신체에 대략적으로 맞춘다. 그 다음, 정렬 불일치 영역을 효과적으로 처리하고 1024x768 입력의 세부 정보를 보존하기 위해 ALIgnment-Aware Segment (ALIAS) 정규화 및 ALIAS 생성기(Generator)를 제안한다. 기존 방법들과의 엄격한 비교를 통해, VITON-HD가 정성적 및 정량적으로 모두 기존 기준 대비 뛰어난 합성 이미지 품질을 달성함을 입증한다. 코드는 https://github.com/shadow2496/VITON-HD 에서 공개되어 있다.

VITON-HD: 비일치 인지 정규화를 통한 고해상도 가상 시도 | 최신 연구 논문 | HyperAI초신경