11日前

ドレスコード:高解像度マルチカテゴリ仮想試着

Davide Morelli, Matteo Fincato, Marcella Cornia, Federico Landi, Fabio Cesari, Rita Cucchiara
ドレスコード:高解像度マルチカテゴリ仮想試着
要約

画像ベースのバーチャルトライオンは、対象人物の画像に衣類の外観を移すことを目指している。従来の研究は主に上半身の衣類(たとえばTシャツ、シャツ、トップスなど)に注目しており、全身または下半身の衣類にはほとんど配慮がなかった。この課題の根本的な原因は、現在公に利用可能な画像ベースのバーチャルトライオン用データセットが衣類の多様性を反映しておらず、分野の進展を制限していることにある。この問題を解決するため、本研究では複数カテゴリの衣類を含む「Dress Code」データセットを提案する。Dress Codeは、画像ベースのバーチャルトライオン用に公に提供されている既存のデータセットよりも3倍以上大きく、高解像度のペア画像(1024×768)を備えており、前面視点の全身リファレンスモデルを含んでいる。高品質で詳細豊かな高解像度のトライオン画像を生成するため、細粒度の判別特徴を学習する手法を提案する。具体的には、画像レベルやパッチレベルではなく、画素レベルでの予測を行う意味認識型ディスクリミネータを活用する。広範な実験評価により、提案手法が視覚的品質および定量的評価において、従来手法および最先端の競合手法を上回ることを確認した。Dress Codeデータセットは、https://github.com/aimagelab/dress-code にて公開されている。

ドレスコード:高解像度マルチカテゴリ仮想試着 | 最新論文 | HyperAI超神経