
要約
我々は、困難な人物画像生成タスクに対応するための新規な二部グラフ推論GAN(BiGraphGAN)を提案する。提案するグラフ生成器は、主に2つの新規ブロックから構成されており、それぞれがポーズ間の関係(ポーズ→ポーズ関係)と、ポーズと画像間の関係(ポーズ→画像関係)をモデル化することを目的としている。具体的には、提案する二部グラフ推論(BGR)ブロックは、二部グラフ上で、入力ポーズ(ソースポーズ)と出力ポーズ(ターゲットポーズ)の間の長距離相互作用を推論することを目的としており、ポーズの変形に起因する課題を緩和する。さらに、人物の形状と外見の特徴表現能力を相互作用的に効果的に更新・強化するため、新たな「インタラクション・アグリゲーション(IA)」ブロックを提案する。Market-1501およびDeepFashionという2つの困難で公開されているデータセットにおける実験結果から、提案手法であるBiGraphGANが客観的な定量的スコアおよび主観的な視覚的リアリズムの両面で有効であることが示された。ソースコードおよび学習済みモデルは、https://github.com/Ha0Tang/BiGraphGAN にて公開されている。